Source code for desispec.fiberflat

"""
desispec.fiberflat
==================

Utility functions to compute a fiber flat correction and apply it
We try to keep all the (fits) io separated.
"""
from __future__ import absolute_import, division

import numpy as np
from desispec.resolution import Resolution
from desispec.linalg import cholesky_solve
from desispec.linalg import cholesky_solve_and_invert
from desispec.linalg import spline_fit
from desispec.maskbits import specmask
from desispec.maskedmedian import masked_median
from desispec import util
import scipy,scipy.sparse
import sys
from desiutil.log import get_logger
import math
from desispec.fiberbitmasking import get_fiberbitmasked_frame

[docs]def compute_fiberflat(frame, nsig_clipping=10., accuracy=5.e-4, minval=0.1, maxval=10.,max_iterations=15,smoothing_res=5.,max_bad=100,max_rej_it=5,min_sn=0,diag_epsilon=1e-3) :
    """Compute fiber flat by deriving an average spectrum and dividing all fiber data by this average.
    Input data are expected to be on the same wavelength grid, with uncorrelated noise.
    They however do not have exactly the same resolution.

    Args:
        frame (desispec.Frame): input Frame object with attributes
            wave, flux, ivar, resolution_data
        nsig_clipping : [optional] sigma clipping value for outlier rejection
        accuracy : [optional] accuracy of fiberflat (end test for the iterative loop)
        minval: [optional] mask pixels with flux < minval * median fiberflat.
        maxval: [optional] mask pixels with flux > maxval * median fiberflat.
        max_iterations: [optional] maximum number of iterations
        smoothing_res: [optional] spacing between spline fit nodes for smoothing the fiberflat
        max_bad: [optional] mask entire fiber if more than max_bad-1 initially unmasked pixels are masked during the iterations
        max_rej_it: [optional] reject at most the max_rej_it worst pixels in each iteration
        min_sn: [optional] mask portions with signal to noise less than min_sn
        diag_epsilon: [optional] size of the regularization term in the deconvolution


    Returns:
        desispec.FiberFlat object with attributes
            wave, fiberflat, ivar, mask, meanspec

    Notes:
    - we first iteratively :

       - compute a deconvolved mean spectrum
       - compute a fiber flat using the resolution convolved mean spectrum for each fiber
       - smooth the fiber flat along wavelength
       - clip outliers

    - then we compute a fiberflat at the native fiber resolution (not smoothed)

    - the routine returns the fiberflat, its inverse variance , mask, and the deconvolved mean spectrum

    - the fiberflat is the ratio data/mean , so this flat should be divided to the data

    NOTE THAT THIS CODE HAS NOT BEEN TESTED WITH ACTUAL FIBER TRANSMISSION VARIATIONS,
    OUTLIER PIXELS, DEAD COLUMNS ...
    """
    log=get_logger()
    log.info("starting")

    #
    # chi2 = sum_(fiber f) sum_(wavelenght i) w_fi ( D_fi - F_fi (R_f M)_i )
    #
    # where
    # w = inverse variance
    # D = flux data (at the resolution of the fiber)
    # F = smooth fiber flat
    # R = resolution data
    # M = mean deconvolved spectrum
    #
    # M = A^{-1} B
    # with
    # A_kl = sum_(fiber f) sum_(wavelenght i) w_fi F_fi^2 (R_fki R_fli)
    # B_k = sum_(fiber f) sum_(wavelenght i) w_fi D_fi F_fi R_fki
    #
    # defining R'_fi = sqrt(w_fi) F_fi R_fi
    # and      D'_fi = sqrt(w_fi) D_fi
    #
    # A = sum_(fiber f) R'_f R'_f^T
    # B = sum_(fiber f) R'_f D'_f
    # (it's faster that way, and we try to use sparse matrices as much as possible)
    #

    #- if problematic fibers, set ivars to 0 and mask them with specmask.BADFIBER
    frame = get_fiberbitmasked_frame(frame,bitmask='flat',ivar_framemask=True)

    #- Shortcuts
    nwave=frame.nwave
    nfibers=frame.nspec
    wave = frame.wave.copy()  #- this will become part of output too
    ivar = frame.ivar.copy()
    flux = frame.flux.copy()
    camera = frame.meta['CAMERA']

    # iterative fitting and clipping to get precise mean spectrum


    # we first need to iterate to converge on a solution of mean spectrum
    # and smooth fiber flat. several interations are needed when
    # throughput AND resolution vary from fiber to fiber.
    # the end test is that the fiber flat has varied by less than accuracy
    # of previous iteration for all wavelength
    # we also have a max. number of iterations for this code

    nout_tot=0
    chi2pdf = 0.

    smooth_fiberflat=np.ones((flux.shape))

    chi2=np.zeros((flux.shape))

    ## mask low sn portions
    w = flux*np.sqrt(ivar)<min_sn
    ivar[w]=0

    ## 0th pass: reject pixels according to minval and maxval
    mean_spectrum = np.zeros(flux.shape[1])
    nbad=np.zeros(nfibers,dtype=int)
    for iteration in range(max_iterations):
        for i in range(flux.shape[1]):
            w = ivar[:,i]>0
            if w.sum()>0:
                mean_spectrum[i] = np.median(flux[w,i])

        nbad_it=0
        for fib in range(nfibers):
            w = ((flux[fib,:]<minval*mean_spectrum) | (flux[fib,:]>maxval*mean_spectrum)) & (ivar[fib,:]>0)
            nbad_it+=w.sum()
            nbad[fib]+=w.sum()

            if w.sum()>0:
                ivar[fib,w]=0
                log.warning("0th pass: masking {} pixels in fiber {}".format(w.sum(),fib))
            if nbad[fib]>=max_bad:
                ivar[fib,:]=0
                log.warning("0th pass: masking entire fiber {} (nbad={})".format(fib,nbad[fib]))
        if nbad_it == 0:
            break

    # 1st pass is median for spectrum, flat field without resolution
    # outlier rejection
    for iteration in range(max_iterations) :

        # use median for spectrum
        mean_spectrum=np.zeros((flux.shape[1]))
        for i in range(flux.shape[1]) :
            w=ivar[:,i]>0
            if w.sum() > 0 :
                mean_spectrum[i]=np.median(flux[w,i])

        nbad_it=0
        sum_chi2 = 0
        # not more than max_rej_it pixels per fiber at a time
        for fib in range(nfibers) :
            w=ivar[fib,:]>0
            if w.sum()==0:
                continue
            F = flux[fib,:]*0
            w=(mean_spectrum!=0) & (ivar[fib,:]>0)
            F[w]= flux[fib,w]/mean_spectrum[w]
            try :
                smooth_fiberflat[fib,:] = spline_fit(wave,wave[w],F[w],smoothing_res,ivar[fib,w]*mean_spectrum[w]**2,max_resolution=1.5*smoothing_res)
            except (ValueError, TypeError) as err  :
                log.error("Error when smoothing the {} flat".format(camera))
                log.error("Setting ivar=0 for {} fiber {} because spline fit failed".format(camera, fib))
                ivar[fib,:] *= 0
            chi2 = ivar[fib,:]*(flux[fib,:]-mean_spectrum*smooth_fiberflat[fib,:])**2
            w=np.isnan(chi2)
            bad=np.where(chi2>nsig_clipping**2)[0]
            if bad.size>0 :
                if bad.size>max_rej_it : # not more than 5 pixels at a time
                    ii=np.argsort(chi2[bad])
                    bad=bad[ii[-max_rej_it:]]
                ivar[fib,bad] = 0
                log.warning("1st pass: rejecting {} pixels from fiber {}".format(len(bad),fib))
                nbad[fib]+=len(bad)
                if nbad[fib]>=max_bad:
                    ivar[fib,:]=0
                    log.warning("1st pass: rejecting fiber {} due to too many (new) bad pixels".format(fib))
                nbad_it+=len(bad)

            sum_chi2+=chi2.sum()
        ndf=int((ivar>0).sum()-nwave-nfibers*(nwave/smoothing_res))
        chi2pdf=0.
        if ndf>0 :
            chi2pdf=sum_chi2/ndf
        log.info("1st pass iter #{} chi2={}/{} chi2pdf={} nout={} (nsig={})".format(iteration,sum_chi2,ndf,chi2pdf,nbad_it,nsig_clipping))

        if nbad_it == 0 :
            break
    ## flatten fiberflat
    ## normalize smooth_fiberflat:
    mean=np.ones(smooth_fiberflat.shape[1])
    for i in range(smooth_fiberflat.shape[1]):
        w=ivar[:,i]>0
        if w.sum()>0:
            mean[i]=np.median(smooth_fiberflat[w,i])
    smooth_fiberflat = smooth_fiberflat/mean

    median_spectrum = mean_spectrum*1.

    previous_smooth_fiberflat = smooth_fiberflat*0
    previous_max_diff = 0.
    log.info("after 1st pass : nout = %d/%d"%(np.sum(ivar==0),np.size(ivar.flatten())))
    # 2nd pass is full solution including deconvolved spectrum, no outlier rejection
    for iteration in range(max_iterations) :
        ## reset sum_chi2
        sum_chi2=0
        log.info("2nd pass, iter %d : mean deconvolved spectrum"%iteration)

        # fit mean spectrum
        A=scipy.sparse.lil_matrix((nwave,nwave)).tocsr()
        B=np.zeros((nwave))

        # diagonal sparse matrix with content = sqrt(ivar)*flat of a given fiber
        SD=scipy.sparse.lil_matrix((nwave,nwave))

        # this is to go a bit faster
        sqrtwflat=np.sqrt(ivar)*smooth_fiberflat

        # loop on fiber to handle resolution (this is long)
        for fiber in range(nfibers) :
            if fiber%100==0 :
                log.info("2nd pass, filling matrix, iter %d fiber %d"%(iteration,fiber))

            ### R = Resolution(resolution_data[fiber])
            R = frame.R[fiber]
            SD.setdiag(sqrtwflat[fiber])

            sqrtwflatR = SD*R # each row r of R is multiplied by sqrtwflat[r]

            A = A+(sqrtwflatR.T*sqrtwflatR).tocsr()
            B += sqrtwflatR.T.dot(np.sqrt(ivar[fiber])*flux[fiber])
        A_pos_def = A.todense()
        log.info("deconvolving")
        w = A.diagonal() > 0

        A_pos_def = A_pos_def[w,:]
        A_pos_def = A_pos_def[:,w]
        mean_spectrum = np.zeros(nwave)
        try:
            mean_spectrum[w]=cholesky_solve(A_pos_def,B[w])
        except:
            mean_spectrum[w]=np.linalg.lstsq(A_pos_def,B[w])[0]
            log.info("cholesky failes, trying svd inverse in iter {}".format(iteration))

        for fiber in range(nfibers) :

            if np.sum(ivar[fiber]>0)==0 :
                continue

            ### R = Resolution(resolution_data[fiber])
            R = frame.R[fiber]

            M = R.dot(mean_spectrum)
            ok=(M!=0) & (ivar[fiber,:]>0)
            if ok.sum()==0:
                continue
            try :
                smooth_fiberflat[fiber] = spline_fit(wave,wave[ok],flux[fiber,ok]/M[ok],smoothing_res,ivar[fiber,ok]*M[ok]**2,max_resolution=1.5*smoothing_res)*(ivar[fiber,:]*M**2>0)
            except (ValueError, TypeError) as err  :
                log.error("Error when smoothing the flat")
                log.error("Setting ivar=0 for fiber {} because spline fit failed".format(fiber))
                ivar[fiber,:] *= 0
            chi2 = ivar[fiber]*(flux[fiber]-smooth_fiberflat[fiber]*M)**2
            sum_chi2 += chi2.sum()
            w=np.isnan(smooth_fiberflat[fiber])
            if w.sum()>0:
                ivar[fiber]=0
                smooth_fiberflat[fiber]=1

        # normalize to get a mean fiberflat=1
        mean = np.ones(smooth_fiberflat.shape[1])
        for i in range(nwave):
            w = ivar[:,i]>0
            if w.sum()>0:
                mean[i]=np.median(smooth_fiberflat[w,i])
        ok=np.where(mean!=0)[0]
        smooth_fiberflat[:,ok] /= mean[ok]

        # this is the max difference between two iterations
        max_diff=np.max(np.abs(smooth_fiberflat-previous_smooth_fiberflat)*(ivar>0.))
        previous_smooth_fiberflat=smooth_fiberflat.copy()

        ndf=int(np.sum(ivar>0)-nwave-nfibers*(nwave/smoothing_res))
        chi2pdf=0.
        if ndf>0 :
            chi2pdf=sum_chi2/ndf
        log.info("2nd pass, iter %d, chi2=%f ndf=%d chi2pdf=%f"%(iteration,sum_chi2,ndf,chi2pdf))


        if max_diff<accuracy :
            break

        if np.abs(max_diff-previous_max_diff)<accuracy*0.1 :
            log.warning("no significant improvement on max diff, quit loop")
            break

        previous_max_diff=max_diff

        log.info("2nd pass, iter %d, max diff. = %g > requirement = %g, continue iterating"%(iteration,max_diff,accuracy))




    log.info("Total number of masked pixels=%d"%nout_tot)
    log.info("3rd pass, final computation of fiber flat")

    # now use mean spectrum to compute flat field correction without any smoothing
    # because sharp feature can arise if dead columns

    fiberflat=np.ones((flux.shape))
    fiberflat_ivar=np.zeros((flux.shape))
    mask=np.zeros((flux.shape), dtype='uint32')

    # reset ivar
    ivar = frame.ivar.copy()

    fiberflat_mask=12 # place holder for actual mask bit when defined

    nsig_for_mask=nsig_clipping # only mask out N sigma outliers

    for fiber in range(nfibers) :

        if np.sum(ivar[fiber]>0)==0 :
            continue

        ### R = Resolution(resolution_data[fiber])
        R = frame.R[fiber]
        M = np.array(np.dot(R.todense(),mean_spectrum)).flatten()
        fiberflat[fiber] = (M!=0)*flux[fiber]/(M+(M==0)) + (M==0)
        fiberflat_ivar[fiber] = ivar[fiber]*M**2
        nbad_tot=0
        iteration=0
        while iteration<500 :
            w=fiberflat_ivar[fiber,:]>0
            if w.sum()<100:
                break
            try :
                smooth_fiberflat=spline_fit(wave,wave[w],fiberflat[fiber,w],smoothing_res,fiberflat_ivar[fiber,w])
            except (ValueError, TypeError) as e :
                print("error in spline_fit")
                mask[fiber] += fiberflat_mask
                fiberflat_ivar[fiber] = 0.
                break

            chi2=fiberflat_ivar[fiber]*(fiberflat[fiber]-smooth_fiberflat)**2
            bad=np.where(chi2>nsig_for_mask**2)[0]
            if bad.size>0 :

                nbadmax=1
                if bad.size>nbadmax : # not more than nbadmax pixels at a time
                    ii=np.argsort(chi2[bad])
                    bad=bad[ii[-nbadmax:]]

                mask[fiber,bad] += fiberflat_mask
                fiberflat_ivar[fiber,bad] = 0.
                nbad_tot += bad.size
            else :
                break
            iteration += 1


        log.info("3rd pass : fiber #%d , number of iterations %d"%(fiber,iteration))


    # set median flat to 1
    log.info("3rd pass : set median fiberflat to 1")

    mean=np.ones((flux.shape[1]))
    for i in range(flux.shape[1]) :
        ok=np.where((mask[:,i]==0)&(ivar[:,i]>0))[0]
        if ok.size > 0 :
            mean[i] = np.median(fiberflat[ok,i])
    ok=np.where(mean!=0)[0]
    for fiber in range(nfibers) :
        fiberflat[fiber,ok] /= mean[ok]

    log.info("3rd pass : interpolating over masked pixels")


    for fiber in range(nfibers) :

        if np.sum(ivar[fiber]>0)==0 :
            continue
        # replace bad by smooth fiber flat
        bad=np.where((mask[fiber]>0)|(fiberflat_ivar[fiber]==0)|(fiberflat[fiber]<minval)|(fiberflat[fiber]>maxval))[0]

        if bad.size>0 :

            fiberflat_ivar[fiber,bad] = 0

            # find max length of segment with bad pix
            length=0
            for i in range(bad.size) :
                ib=bad[i]
                ilength=1
                tmp=ib
                for jb in bad[i+1:] :
                    if jb==tmp+1 :
                        ilength +=1
                        tmp=jb
                    else :
                        break
                length=max(length,ilength)
            if length>10 :
                log.info("3rd pass : fiber #%d has a max length of bad pixels=%d"%(fiber,length))
            smoothing_res=float(max(100,length))
            x=np.arange(wave.size)

            ok=fiberflat_ivar[fiber]>0
            if ok.sum()==0:
                continue
            try:
                smooth_fiberflat=spline_fit(x,x[ok],fiberflat[fiber,ok],smoothing_res,fiberflat_ivar[fiber,ok])
                fiberflat[fiber,bad] = smooth_fiberflat[bad]
            except:
                fiberflat[fiber,bad] = 1
                fiberflat_ivar[fiber,bad]=0

        if nbad_tot>0 :
            log.info("3rd pass : fiber #%d masked pixels = %d (%d iterations)"%(fiber,nbad_tot,iteration))

    # set median flat to 1
    log.info("set median fiberflat to 1")

    mean=np.ones((flux.shape[1]))
    for i in range(flux.shape[1]) :
        ok=np.where((mask[:,i]==0)&(ivar[:,i]>0))[0]
        if ok.size > 0 :
            mean[i] = np.median(fiberflat[ok,i])
    ok=np.where(mean!=0)[0]
    for fiber in range(nfibers) :
        fiberflat[fiber,ok] /= mean[ok]

    log.info("done fiberflat")

    log.info("add a systematic error of 0.0035 to fiberflat variance (calibrated on sims)")
    fiberflat_ivar = (fiberflat_ivar>0)/( 1./ (fiberflat_ivar+(fiberflat_ivar==0) ) + 0.0035**2)

    fiberflat = FiberFlat(wave, fiberflat, fiberflat_ivar, mask, mean_spectrum,
                     chi2pdf=chi2pdf,header=frame.meta,fibermap=frame.fibermap)

    #for broken_fiber in broken_fibers :
    #    log.info("mask broken fiber {} in flat".format(broken_fiber))
    #    fiberflat.fiberflat[fiber]=1.
    #    fiberflat.ivar[fiber]=0.
    #    fiberflat.mask[fiber]=specmask.BADFIBERFLAT

    return fiberflat

[docs]def average_fiberflat(fiberflats):
    """Average several fiberflats
    Args:
        fiberflats : list of `desispec.FiberFlat` object

    returns a desispec.FiberFlat object
    """

    log=get_logger()
    log.info("starting")

    if len(fiberflats) == 0 :
        message = "input fiberflat list is empty"
        log.critical(message)
        raise ValueError(message)
    if len(fiberflats) == 1 :
        log.warning("only one fiberflat to average??")
        return fiberflats[0]

    # check wavelength range
    for fflat in fiberflats[1:] :
        if not np.allclose(fiberflats[0].wave, fflat.wave):
            message = "fiberflats do not have the same wavelength arrays"
            log.critical(message)
            raise ValueError(message)
    wave = fiberflats[0].wave

    fiberflat = None
    ivar      = None
    if len(fiberflats) > 2 :
        log.info("{} fiberflat to average, use masked median".format(len(fiberflats)))
        tmp_fflat = []
        tmp_ivar  = []
        tmp_mask  = []
        for tmp in fiberflats :
            tmp_fflat.append(tmp.fiberflat)
            tmp_ivar.append(tmp.ivar)
            tmp_mask.append(tmp.mask)
        fiberflat = masked_median(np.array(tmp_fflat),np.array(tmp_mask))
        ivar      = np.sum(np.array(tmp_ivar),axis=0)
        ivar     *= 2./np.pi # penalty for using a median instead of a mean
    else :
        log.info("{} fiberflat to average, use weighted mean".format(len(fiberflats)))
        sw=None
        swf=None
        for tmp in fiberflats :
            w   = (tmp.ivar)*(tmp.mask==0)
            if sw is None :
                sw   = w
                swf  = w*tmp.fiberflat
                mask = tmp.mask
            else :
                sw  += w
                swf += w*tmp.fiberflat
        fiberflat = swf/(sw+(sw==0))
        ivar      = sw

    # combined mask
    mask=None
    for tmp in fiberflats :
        if mask is None :
            mask = tmp.mask
        else :
            ii=(mask>0)&(tmp.mask>0)
            mask[ii] |= tmp.mask[ii]
            mask[tmp.mask==0] = 0 # mask=0 on fiber and wave data point where at list one fiberflat has mask=0

    # average mean spec
    meanspec = None
    if fiberflats[0].meanspec is not None :
        #meanspec = np.zeros(fiberflats[0].meanspec.shape)
        swf = np.zeros(fiberflats[0].meanspec.shape)
        sw  = np.zeros(fiberflats[0].meanspec.shape)
        for tmp in fiberflats :
            # try to use same weigths as above
            if len(fiberflats) > 2 :
                #w = np.sum(tmp.ivar*(tmp.mask==0),axis=0)/(tmp.meanspec*(tmp.meanspec>0)+(tmp.meanspec<=0))**2*(tmp.meanspec>0)
                w = np.sum((tmp.ivar>0)*(tmp.mask==0),axis=0)
            else : # was weigthed average
                w = np.sum(tmp.ivar*(tmp.mask==0),axis=0)
            sw  += w
            swf += w*tmp.meanspec
        ok=(sw>0)
        if np.sum(ok)>0 :
            meanspec = np.zeros(fiberflats[0].meanspec.shape)
            meanspec[ok] = swf[ok]/sw[ok]

    return FiberFlat(wave,fiberflat,ivar,mask,
                     meanspec=meanspec,
                     header=fiberflats[0].header,
                     fibers=fiberflats[0].fibers,
                     fibermap=fiberflats[0].fibermap,
                     spectrograph=fiberflats[0].spectrograph)

[docs]def autocalib_fiberflat(fiberflats):
    """Combine fiberflats of all spectrographs from different lamps to maximize uniformity
    Args:
        fiberflats : list of `desispec.FiberFlat` object

    returns a dictionary of desispec.FiberFlat objects , one per spectrograph
    """

    log=get_logger()
    log.info("starting")

    if len(fiberflats) == 0 :
        message = "input fiberflat list is empty"
        log.critical(message)
        raise ValueError(message)
    if len(fiberflats) == 1 :
        log.warning("only one fiberflat to average??")
        return fiberflats[0]

    # check wavelength range
    for fflat in fiberflats[1:] :
        if not np.allclose(fiberflats[0].wave, fflat.wave):
            message = "fiberflats do not have the same wavelength arrays"
            log.critical(message)
            raise ValueError(message)
    wave = fiberflats[0].wave

    # investigate number of spectrographs and number of exposures
    spectro=[]
    expid=[]
    for fflat in fiberflats :
        expid.append(fflat.header["EXPID"])
        s=int(fflat.header["CAMERA"].strip()[1])
        spectro.append(s)
    expid=np.array(expid)
    spectro=np.array(spectro)
    log.info("EXPID: {}".format(np.unique(expid)))
    log.info("SPECTRO: {}".format(np.unique(spectro)))


    cfflat=dict()
    for ee in np.unique(expid) :
        log.info("Fit fiberflats of exposure #{}".format(ee))
        ii = np.where(expid==ee)[0]
        nwave = fiberflats[ii[0]].meanspec.size

        # same mean spectrum for all petals of same exposure
        mmspec=np.zeros(nwave)
        for i in ii :
            fflat=fiberflats[i]
            mmspec += fflat.meanspec
        mmspec /= ii.size
        for i in ii :
            fflat=fiberflats[i]
            scale = fflat.meanspec/(mmspec+(mmspec==0))
            fflat.fiberflat *= scale

        # fit a 2D polynomial per wavelenght to get the fiberflat at the center of the focal plane
        cfflat[ee] = np.zeros(nwave)
        X = []
        Y = []
        Z = []
        for i in ii :
            fflat=fiberflats[i]
            # select only valid fibers here
            nw=fflat.fiberflat.shape[1]
            # more than half of the pixels are valid
            jj=(np.sum((fflat.ivar>0)*(fflat.mask==0),axis=1)>nw//2)&(fflat.fibermap["FIBERSTATUS"]==0)
            log.debug("number of valid fibers in exp {} spectro {} = {}".format(expid[i],spectro[i],np.sum(jj)))
            X.append(fflat.fibermap["FIBERASSIGN_X"][jj])
            Y.append(fflat.fibermap["FIBERASSIGN_Y"][jj])
            Z.append(fflat.fiberflat[jj])
        X = np.hstack(X)
        Y = np.hstack(Y)
        Z = np.vstack(Z)
        A = np.array([X*0+1, X, Y, X**2+Y**2]).T
        for j in range(nwave) :
            coeff, r, rank, s = np.linalg.lstsq(A, Z[:,j],rcond=-1)
            cfflat[ee][j] = coeff[0] # value at center of field of view
        log.debug("median value at center of field for exp {} = {}".format(expid[i],np.median(cfflat[ee])))

    # combine the fiber flat of each exposure, per spectrum
    output_fiberflats = dict()
    mflat = list()
    for spec in np.unique(spectro) :
        log.info("Combine fiberflats for spectro #{}".format(spec))
        ii = np.where(spectro==spec)[0]
        fflat0=fiberflats[ii[0]]
        fiberflat = np.zeros_like(fflat0.fiberflat)
        var       = np.zeros_like(fflat0.ivar)
        mask      = np.zeros_like(fflat0.mask)
        meanspec  = np.zeros_like(fflat0.meanspec)

        for i in ii :
            ee = expid[i]
            corr = 1./(cfflat[ee]+(cfflat[ee]==0))
            fiberflat += fiberflats[i].fiberflat*corr
            var       += corr**2/(fiberflats[i].ivar+(fiberflats[i].ivar==0))+1e12*(fiberflats[i].ivar==0)
            mask      |=  fiberflats[i].mask
            meanspec  +=  fiberflats[i].meanspec*corr # this is quite artificial now

        var /= (ii.size)**2
        ivar      = (var>0)/(var+(var==0))
        fiberflat /= ii.size
        meanspec /= ii.size
        fflat = FiberFlat(fflat0.wave,fiberflat,ivar,mask,
                          meanspec=meanspec,
                          header=fflat0.header,
                          fibers=fflat0.fibers,
                          fibermap=fflat0.fibermap,
                          spectrograph=fflat0.spectrograph)
        output_fiberflats[spec] = fflat
        mflat.append(np.median(fiberflat,axis=0))
    mflat=np.median(np.array(mflat),axis=0)
    corr=1./(mflat+(mflat==0))
    for spec in np.unique(spectro) :
        output_fiberflats[spec].fiberflat *= corr
        #mask_bad_fiberflat(output_fiberflats[spec])
        filter_fiberflat(output_fiberflats[spec])
    log.info("done")
    return output_fiberflats


[docs]def gradient_correction(fiberflats, ref_fiberflats, iterations=5, max_gradient=0.2):
    '''
    Apply gradient correction for the fiber flats.

    Args:
        fiberflats: a dictionary of desispec.FiberFlat objects, one per spectrograph,
            e.g., output from autocalib_fiberflat
        ref_fiberflats: same as fiberflats but for the reference night
        iterations: number of iterations for the outlier rejection; default is 5
        max_gradient: maximum gradient defined as center-to-edge difference; default is 0.2

    Returns:
        Same as the fiberflats input but with gradient-removed fiberflat attribute
    '''
    from astropy.table import Table, vstack
    nmad = lambda x: 1.4826 * np.median(np.abs(x-np.median(x)))  # normalized median absolute deviation

    log=get_logger()

    ffall = []
    for spectro in fiberflats.keys():
        fiberflat = fiberflats[spectro]
        refflat = ref_fiberflats[spectro]
        ff = Table(fiberflat.fibermap)[['FIBERASSIGN_X', 'FIBERASSIGN_Y']].copy()
        ff['FF_RATIO'] = np.mean(fiberflat.fiberflat, axis=1) / np.mean(refflat.fiberflat, axis=1)
        ffall.append(ff)
    ff = vstack(ffall)

    # Iteratively reject outliers
    mask_outlier = (ff['FF_RATIO']<0.9) | (ff['FF_RATIO']>1.1)  # initial outlier rejection
    log.info('initial outlier fiber count: {}'.format(np.sum(mask_outlier)))
    for iteration in range(iterations):
        intercept, y_slope, x_slope = poly_fit_2d(ff['FIBERASSIGN_X'][~mask_outlier], ff['FIBERASSIGN_Y'][~mask_outlier], ff['FF_RATIO'][~mask_outlier], order=1)
        ff_ratio_corr = ff['FF_RATIO'] / poly_val_2d(ff['FIBERASSIGN_X'], ff['FIBERASSIGN_Y'], [intercept, y_slope, x_slope])
        rms = nmad(ff_ratio_corr)
        mask_outlier = (ff_ratio_corr<1-4*rms) | (ff_ratio_corr>1+4*rms)  # 4-sigma clipping
    log.info('final outlier fibers count: {}'.format(np.sum(mask_outlier)))

    amp = np.sqrt(x_slope**2+y_slope**2)  # amplitude of the gradient in units of mm^-1
    center_to_edge = amp * 407.5  # gradient center-to-edge difference; 407.5 is the maximum distance (in mm) between a fiber and the focal plane center
    angle = np.degrees(np.arctan2(x_slope, y_slope))
    log.info('intercept = {:.4f} x_slope = {:.4f} y_slope = {:.4f} gradient angle = {:.1f} amplitude = {:.3e} center-to-edge difference = {:.1f}%'.format(
        intercept, x_slope, y_slope, angle, amp, 100.*center_to_edge))
    if center_to_edge>max_gradient:
        msg = 'gradient center-to-edge difference larger than {:.1f}% !'.format(100.*max_gradient)
        log.critical(msg)
        raise RuntimeError(msg)

    for spectro in fiberflats.keys():
        x, y = fiberflats[spectro].fibermap['FIBERASSIGN_X'], fiberflats[spectro].fibermap['FIBERASSIGN_Y']
        fiberflats[spectro].fiberflat /= poly_val_2d(x, y, [1, y_slope, x_slope])[:, None]  # force the intercept to be 1
        fiberflats[spectro].header['GRADX'] = (x_slope, 'Gradient correction slope in X direction')
        fiberflats[spectro].header['GRADY'] = (y_slope, 'Gradient correction slope in Y direction')

    return fiberflats


[docs]def poly_fit_2d(x, y, z, order=1):
    '''
    2D polynomial fit. Given x, y and z arrays, calculate the 2D polynomial fit of arbitrary order.

    Args:
    x, y and z: 1D arrays
    order: order of the polynomial fit

    Returns:
    Array of parameters of the polynomial [a0, a1, a2 ...]
    so that for an n-th order fit
    z = a0 + a1*y + a2*y**2 + ... + a_n*y**n + a_(n+1)*x
    + a_(n+2)*x*y + a_(n+3)*x*y**2 + ... + a_(2n)*x*y**(n-1)
    + a_(2n+1)*x**2 + a_(2n+2)*x**2*y + ... ...

    For example 2nd order fit gives:
    z = a0 + a1*y + a2*y**2 + a3*x + a4*x*y + a5*x**2
    '''

    ncols = (order+2)*(order+1)//2
    a = np.zeros((x.size, ncols))
    k=0
    for i in range(order+1):
        for j in range(order-i+1):
            a[:, k] = x**i * y**j
            k+=1
    res = np.linalg.lstsq(a, z, rcond=None)
    m = res[0]
    return m


[docs]def poly_val_2d(x, y, m):
    '''
    Evaluate the 2D polynomial from x and y values and polynomial coefficients

    Args:
    x, y: 1D arrays
    m: 1D array of polynomial parameters (generated by poly_fit_2d)

    Returns:
    1D array of the evaluated values of the polynomial
    '''

    order = int((np.sqrt(8*len(m)+1)-3)/2)
    z = np.zeros(x.shape)
    k=0
    for i in range(order+1):
        for j in range(order-i+1):
            z += m[k] * x**i * y**j
            k+=1
    return z


def mask_bad_fiberflat(fiberflat) :
    log = get_logger()

    for fiber in range(fiberflat.fiberflat.shape[0]) :
        fiberflat.mask[fiber][fiberflat.fiberflat[fiber]<0.1] |= specmask.LOWFLAT
        fiberflat.mask[fiber][fiberflat.fiberflat[fiber]>2.] |= specmask.BADFIBERFLAT
        nbad = np.sum((fiberflat.ivar[fiber]==0)|(fiberflat.mask[fiber]!=0))
        if nbad > 500 :
            log.warning("fiber {} is 'BAD' because {} flatfield values are bad".format(fiber,nbad))
            fiberflat.fiberflat[fiber]=1.
            fiberflat.ivar[fiber]=0.
            fiberflat.mask[fiber] |= specmask.BADFIBERFLAT

def filter_fiberflat(fiberflat) :
    log = get_logger()
    var=1/(fiberflat.ivar+(fiberflat.ivar==0)*0.000001)
    diff=np.zeros(fiberflat.fiberflat.shape[1])
    diffvar=np.zeros(fiberflat.fiberflat.shape[1])
    for fiber in range(fiberflat.fiberflat.shape[0]) :
        diff[1:-1] = fiberflat.fiberflat[fiber,1:-1]-(fiberflat.fiberflat[fiber,:-2]+fiberflat.fiberflat[fiber,2:])/2.
        diffvar[1:-1] = var[fiber,1:-1]+(var[fiber,:-2]+var[fiber,2:])/4.
        isbad=(diff>(0.1+3*np.sqrt(diffvar)))|(var[fiber]>0.05**2)
        bad=np.where(isbad)[0] # spike is probably a cosmic
        good=np.where(isbad!=True)[0]
        if bad.size>0 and good.size>0 :
            badflat=fiberflat.fiberflat[fiber,bad].copy()
            fiberflat.fiberflat[fiber,bad] = np.interp(fiberflat.wave[bad],fiberflat.wave[good],fiberflat.fiberflat[fiber,good],left=1,right=1)
    return fiberflat

[docs]def apply_fiberflat(frame, fiberflat):
    """Apply fiberflat to frame.  Modifies frame.flux and frame.ivar.
       Checks whether an heliocentric correction has been applied
       to the frame wavelength in which case also apply it to the
       flat field array.

    Args:
        frame : `desispec.Frame` object
        fiberflat : `desispec.FiberFlat` object

    The frame is divided by the fiberflat, except where the fiberflat=0.

    frame.mask gets bit specmask.BADFIBERFLAT set where
      * fiberflat.fiberflat == 0
      * fiberflat.ivar == 0
      * fiberflat.mask != 0
    """
    log=get_logger()
    log.info("starting")

    # check same wavelength, die if not the case
    if not np.allclose(frame.wave, fiberflat.wave):
        message = "frame and fiberflat do not have the same wavelength arrays"
        log.critical(message)
        raise ValueError(message)

    """
     F'=F/C
     Var(F') = Var(F)/C**2 + F**2*(  d(1/C)/dC )**2*Var(C)
             = 1/(ivar(F)*C**2) + F**2*(1/C**2)**2*Var(C)
             = 1/(ivar(F)*C**2) + F**2*Var(C)/C**4
             = 1/(ivar(F)*C**2) + F**2/(ivar(C)*C**4)
    """
    #- shorthand
    ff = fiberflat
    sp = frame  #- sp=spectra for this frame

    #- check for heliocentric correction
    if sp.meta is not None and 'HELIOCOR' in sp.meta :
        heliocor=sp.meta['HELIOCOR']
        log.info("Also apply heliocentric correction scale factor {} to fiber flat".format(heliocor))
        # first apply the multiplicative factor
        fiberflat_wave_in_frame_system = ff.wave*heliocor
        # then interpolate to the grid in the frame
        # (it's different because we applied the inverse transform to the wave array
        # used for extraction to avoid resampling the data, see desispec.scripts.extract)
        for fiber in range(ff.fiberflat.shape[0]) :
            good = (ff.ivar[fiber]>0)
            if np.sum(good)>0 :
                ff.fiberflat[fiber] = np.interp(sp.wave,fiberflat_wave_in_frame_system[good],ff.fiberflat[fiber][good])
                # we do not modify the ivar because the correction is smaller than 1 flux bin

    #- update sp.ivar first since it depends upon the original sp.flux
    sp.ivar=(sp.ivar>0)*(ff.ivar>0)*(ff.fiberflat>0)/( 1./((sp.ivar+(sp.ivar==0))*(ff.fiberflat**2+(ff.fiberflat==0))) + sp.flux**2/(ff.ivar*ff.fiberflat**4+(ff.ivar*ff.fiberflat==0)) )

    #- Then update sp.flux, taking care not to divide by 0
    ii = np.where(ff.fiberflat > 0)
    sp.flux[ii] = sp.flux[ii] / ff.fiberflat[ii]

    badff = (ff.fiberflat == 0.0) | (ff.ivar == 0) | (ff.mask != 0)
    sp.mask[badff] |= specmask.BADFIBERFLAT

    log.info("done")


class FiberFlat(object):
    def __init__(self, wave, fiberflat, ivar, mask=None, meanspec=None,
            chi2pdf=None, header=None, fibers=None, fibermap=None, spectrograph=0):
        """
        Creates a lightweight data wrapper for fiber flats

        Args:
            wave: 1D[nwave] wavelength in Angstroms
            fiberflat: 2D[nspec, nwave]
            ivar: 2D[nspec, nwave] inverse variance of fiberflat

        Optional inputs:
            mask: 2D[nspec, nwave] mask where 0=good; default ivar==0; 32-bit
            meanspec: (optional) 1D[nwave] mean deconvolved average flat lamp spectrum
            chi2pdf: (optional) Normalized chi^2 for fit to mean spectrum
            header: (optional) FITS header from HDU0
            fibers: (optional) fiber indices
            fibermap: fibermap table
            spectrograph: (optional) spectrograph number [0-9]
        """
        if wave.ndim != 1:
            raise ValueError("wave should be 1D")

        if fiberflat.ndim != 2:
            raise ValueError("fiberflat should be 2D[nspec, nwave]")

        if ivar.ndim != 2:
            raise ValueError("ivar should be 2D")

        if fiberflat.shape != ivar.shape:
            raise ValueError("fiberflat and ivar must have the same shape")

        if mask is not None and mask.ndim != 2:
            raise ValueError("mask should be 2D")

        if meanspec is not None and meanspec.ndim != 1:
            raise ValueError("meanspec should be 1D")

        if mask is not None and fiberflat.shape != mask.shape:
            raise ValueError("fiberflat and mask must have the same shape")

        if meanspec is not None and wave.shape != meanspec.shape:
            raise ValueError("wrong size/shape for meanspec {}".format(meanspec.shape))

        if wave.shape[0] != fiberflat.shape[1]:
            raise ValueError("nwave mismatch between wave.shape[0] and flux.shape[1]")

        if mask is None:
            mask = (ivar == 0)

        if meanspec is None:
            meanspec = np.ones_like(wave)

        self.wave = wave
        self.fiberflat = fiberflat
        self.ivar = ivar
        self.mask = util.mask32(mask)
        self.meanspec = meanspec

        self.nspec, self.nwave = self.fiberflat.shape
        self.header = header

        if chi2pdf is not None:
            self.chi2pdf = chi2pdf
        else:
            try:
                self.chi2pdf = header['chi2pdf']
            except (KeyError, TypeError):
                self.chi2pdf = None

        self.fibermap = fibermap
        self.spectrograph = spectrograph
        if fibers is None:
            self.fibers = self.spectrograph + np.arange(self.nspec, dtype=int)
        else:
            if len(fibers) != self.nspec:
                raise ValueError("len(fibers) != nspec ({} != {})".format(len(fibers), self.nspec))
            self.fibers = fibers

    def __getitem__(self, index):
        """
        Return a subset of the spectra as a new FiberFlat object

        index can be anything that can index or slice a numpy array
        """
        #- convert index to 1d array to maintain dimentionality of sliced arrays
        if not isinstance(index, slice):
            index = np.atleast_1d(index)

        if self.fibermap is not None:
            fibermap = self.fibermap[index]
        else:
            fibermap = None

        result = FiberFlat(self.wave, self.fiberflat[index], self.ivar[index],
                           self.mask[index], self.meanspec, header=self.header,
                           fibers=self.fibers[index], fibermap=fibermap,  spectrograph=self.spectrograph)

        #- TODO:
        #- if we define fiber ranges in the fits headers, correct header

        return result

    def __repr__(self):
        """ Print formatting
        """
        return ('{:s}: nspec={:d}, spectrograph={:d}'.format(
                self.__class__.__name__, self.nspec, self.spectrograph))


[docs]def qa_fiberflat(param, frame, fiberflat):
    """ Calculate QA on FiberFlat object

    Args:
        param: dict of QA parameters
        frame: Frame
        fiberflat: FiberFlat

    Returns:
        qadict: dict of QA outputs
          Need to record simple Python objects for yaml (str, float, int)
    """
    from desimodel.focalplane import fiber_area_arcsec2
    log = get_logger()

    # x, y, area
    fibermap = frame.fibermap
    x = fibermap['FIBERASSIGN_X']
    y = fibermap['FIBERASSIGN_Y']
    area = fiber_area_arcsec2(x, y)
    mean_area = np.mean(area)
    norm_area = area / mean_area
    npix = fiberflat.fiberflat.shape[1]

    # Normalize
    norm_flat = fiberflat.fiberflat / np.outer(norm_area, np.ones(npix))

    # Output dict
    qadict = {}

    # Check amplitude of the meanspectrum
    qadict['MAX_MEANSPEC'] = float(np.max(fiberflat.meanspec))
    if qadict['MAX_MEANSPEC'] < 100000:
        log.warning("Low counts in meanspec = {:g}".format(qadict['MAX_MEANSPEC']))

    # Record chi2pdf
    try:
        qadict['CHI2PDF'] = float(fiberflat.chi2pdf)
    except TypeError:
        qadict['CHI2PDF'] = 0.

    # N mask
    qadict['N_MASK'] = int(np.sum(fiberflat.mask > 0))
    if qadict['N_MASK'] > param['MAX_N_MASK']:  # Arbitrary
        log.warning("High rejection rate: {:d}".format(qadict['N_MASK']))

    # Scale (search for low/high throughput)
    gdp = fiberflat.mask == 0
    rtio = (frame.flux / np.outer(norm_area, np.ones(npix))) / np.outer(np.ones(fiberflat.nspec),fiberflat.meanspec)
    scale = np.median(rtio*gdp,axis=1)
    MAX_SCALE_OFF = float(np.max(np.abs(scale-1.)))
    fiber = int(np.argmax(np.abs(scale-1.)))
    qadict['MAX_SCALE_OFF'] = [MAX_SCALE_OFF, fiber]
    if qadict['MAX_SCALE_OFF'][0] > param['MAX_SCALE_OFF']:
        log.warning("Discrepant flux in fiberflat: {:g}, {:d}".format(
                qadict['MAX_SCALE_OFF'][0], qadict['MAX_SCALE_OFF'][1]))

    # Offset in fiberflat
    qadict['MAX_OFF'] = float(np.max(np.abs(norm_flat-1.)))
    if qadict['MAX_OFF'] > param['MAX_OFF']:
        log.warning("Large offset in fiberflat: {:g}".format(qadict['MAX_OFF']))

    # Offset in mean of fiberflat
    #mean = np.mean(fiberflat.fiberflat*gdp,axis=1)
    mean = np.mean(norm_flat*gdp,axis=1)
    fiber = int(np.argmax(np.abs(mean-1.)))
    qadict['MAX_MEAN_OFF'] = [float(np.max(np.abs(mean-1.))), fiber]
    if qadict['MAX_MEAN_OFF'][0] > param['MAX_MEAN_OFF']:
        log.warning("Discrepant mean in fiberflat: {:g}, {:d}".format(
                qadict['MAX_MEAN_OFF'][0], qadict['MAX_MEAN_OFF'][1]))

    # RMS in individual fibers
    rms = np.std(gdp*(norm_flat - np.outer(mean, np.ones(fiberflat.nwave))),axis=1)
    #rms = np.std(gdp*(fiberflat.fiberflat-
    #                  np.outer(mean, np.ones(fiberflat.nwave))),axis=1)
    fiber = int(np.argmax(rms))
    qadict['MAX_RMS'] = [float(np.max(rms)), fiber]
    if qadict['MAX_RMS'][0] > param['MAX_RMS']:
        log.warning("Large RMS in fiberflat: {:g}, {:d}".format(
                qadict['MAX_RMS'][0], qadict['MAX_RMS'][1]))

    # Return
    return qadict