半机翻$^{[1]}$了一段HI Parkes All Sky Survey (HIPASS)中他们对巡天数据进行gradding处理的思想$^{[2]}$,虽然是以澳大利亚的Parkes望远镜来进行的说明,但事实上这种处理思想应该适用于所有多波束single dish望远镜巡天数据中gradding这一步的处理;方法比较自然、简单好用。

单次 HIPASS 扫描的光谱处理结果是一组针对天空中 1300 个独特位置的校准HI光谱。 扫描方法通常每平方度天空提供 1500 个光谱,其中 55 个由每个多波束溃源采集。 在大多数情况下,这些光谱没有连续波纹、基线曲率和残余带通效应。 事实上,考虑到天空中星系的稀疏性,它们也大多没有HI线发射。 此外,由于积分时间仅为 5 秒,单个光谱中的均方根 (rms) 噪声电平通常为 72 mJy(参见原文第 4.3.2 节),因此在单个光谱中只能看到最亮的HI源 光谱。 因此需要一些操作来将各个光谱编译成 HI天空的高信噪比图像。 除了显着提高低流量源的能见度外,这样的操作还可以生成更紧凑、更自然的HI天空表示。 此操作是 Multibeam 成像软件的主要任务。

覆盖南部天空的 388 幅图像定义了投影中心。 使用的投影是正射投影orthographic projection(参见 Kellaway 1946),参考(切线)点位于每个图像的中心。 空间图像测量$8\degree \times 8\degree$; 其中 RA 中的宽度是在图像的中心测量的。 对于$4’\times 4’$的 HIPASS 像素大小(参见HIPASS-specific parameters部分),图像的尺寸为$170\times 160$:光谱上,每个图像包括 1024 个平面(通道),其cz从 -1280 到 12700$km\ s^{-1}$。 每幅图像由 75 次 HIPASS 扫描生成,通常与相邻图像有 10% 的天空重叠(按区域)。

Robust gridding

将单个光谱转换为位置-位置速度cubes需要将光谱放在一个规则的网格上,即网格化gridding。对于地图中的每个像素,网格化过程必须:

(1) 确定哪些光谱对像素有贡献;
(2) 拒绝那些看似包含损坏数据的光谱;
(3) 为每个剩余的光谱赋予一个权重,
(4) 根据输入数据和权重计算像素的值。

用于测量的网格算法针对点源进行了优化:与多波束分辨率相比,预计超过 0.90% 的 HIPASS 源的角度尺寸较小。

Algorithm

网格化的目的是重建天空上某个位置(像素)的流量,给定在目标像素附近不规则分布的位置测量的任意数量的单波束光谱。 图1 显示了该问题的一个代表性示例:在目标像素 P 附近进行了两次观测 A 和 B。观测 A 在距像素中心$r_A$处测量流量$F’_A$,B 在 a 处测量通量$F’_B$距像素中心的距离$r_B$。 图1 显示了两个可能的源 C 和 D,分别具有固有流量 $F_C$和$F_D$。 当然,$F’_A < (F_C+F_D)$和$F’_B < (F_C+F_D)$通常是正确的。

图1. 该图显示了目标像素 P 附近的两个观测值 A 和 B 的位置,场中有两个源 C 和 D。 虚线圆圈表示观测值 A 和 B 的半功率半径。

假设仪器波束形状是已知的 (或可以估计的),则像素P中的流量可以如下估计: 波束形状 (波束灵敏度) 作为加权函数$w(r)$引入,该加权函数仅取决于距波束中心r的距离,从$w(0)\equiv 1$到$w(\infty) \equiv 0$,则

其中 $F_A$ 和 $F_B$ 是由 A 和 B 测量的源 C 和 D 的重构总流量。由于 $r_A>r_B$和 $w(r_A)<w(r_B)$,因此相较于$F_B$,$F_A$ 才是对天空像素P 中流量的不确定性测量 。 然后 $F_A$ 和 $F_B$ 的加权平均值产生流量 $F_e$ 的(简单)统计估计,可以分配给像素 P,权重(再次)由波束灵敏度$ w(r) $提供:

将重建的流量代入该方程,并推广到 N 个点,我们发现:

不幸的是,对于真实数据,均值 ($F’$) 可能会被数据中的人为因素(如干扰)严重破坏。 原则上,这可以通过使用一些预定义的质量标准去手动或自动的明确删除不良数据来纠正。 然而,在实践中,手动数据删除是一项繁琐的工作,容易出现人为错误,而自动数据删除通常取决于任意选择的标准。一个更好的方法是简单地将等式 (3) 中使用的平均统计量替换为统计上更稳健的估计量—中值—与多波束处理中其他地方应用的思想保持一致。 像中值这样的估计量对于大量存在的异常值是稳健的,例如,被干扰破坏的测量值。 统计数据本身可以识别样本中的不寻常元素,并且不需要任意标准来这样做。 只要样本中损坏数据的比例低于 $\sim 30-40 \%$(几乎所有调查数据样本都是如此),中位数统计数据的表现令人钦佩。 因此:

我们将其定义为中值网格。 请注意,我们用中位数代替的均值估计量只是可以选择的众多变量之一。 此外,其他加权方案是可能的,例如,

其中 $\vartheta$是一些统计估计量(例如,均值、中位数等),n 是权重重要性的度量。 通常,$\vartheta = mean$和$n=1$将给出无干扰数据的最小方差结果。

实际上可以通过稍微修改网格算法来估计每个像素的图像误差。 等式 (5) 甚至可以更一般地写为

其中不同的统计估计量$\varphi$和$\vartheta$分别用于通量和权重计算。 在这种形式中,$\varphi$被选为离散的度量,$\vartheta$被选为类均值估计量(例如,均值、中值、1/4),生成的网格图像根据所选的分散度量描述了每个像素中存在的误差。 尽管没有用于本文的目的,但事实证明,使用稳健的色散测量构建的图像对于评估 HIPASS 图像中源检测的重要性极为重要。

等式(3)(因此等式 4 和 5 同样)忽略了图1 中观测 A 和 B 与源 C 和 D 之间的位移。如果不采用迭代天空重建技术,这些观测源位移是无法知道的。 尽管如此,等式 (4) 对于高度冗余和过采样的 HIPASS 数据效果很好。 虽然图1 中的源 C 在观测 B 的半功率半径内,但它只会在其固有强度的一小部分下进行测量,因为观测本身对天空源分布应用了波束加权。 源 C 对观测 A 是不可见的,因此它对像素 P 的贡献权重更低。 推广到高度过采样数据的情况,并应用接近 P 的要求,等式 (4) 中考虑的像素 P 的大多数测量将不会检测到源 C。另一方面,源 D 可能被聚集在 P 周围的大多数观测检测到,因此将在像素 P 中以其固有通量的一小部分重建。对于包含以像素 P 为中心的单点源的天空,等式 (4) 将准确地重建点源。

HIPASS-specific parameters

中值$(w)$的值主要取决于所使用的加权函数$w(r)$和将包括光谱的半径$r_{max}$,以用于计算单像素值。对于HIPASS,假设望远镜波束是二维高斯函数,因此权重函数采取以下形式:

使用 $14.3 arcmin$ 的平均波束宽度,对应于$\sigma = 6.1 arcmin$:中值网格化的推广以使用每个波束的加权函数,虽然简单,但尚未进行,因为它不太可能影响任何显着的图像方法。

平滑半径 ($r_{max}$) 的选择决定了每个像素值有多少光谱贡献,因此部分决定了最终的图像噪声水平。由于量化噪声,平滑半径还最终决定了最终的网格化波束大小。此外,像素大小的选择会影响像素之间的相关性,从而影响表观图像噪声。测试表明,小于4 arcmin的平滑半径不能提供足够的鲁棒性; 这仅仅是因为每个像素的HIPASS光谱数量太低 (通常为30 ± 40)。较大的平滑半径 (>10 arcmin) 会导致分辨率和位置精度的损失。经过广泛的测试,很明显,在获得尽可能低的图像噪声和获得尽可能高的分辨率图像之间需要折衷。HIPASS平滑半径选择为6 arcmin,像素大小选择为4 arcmin。

对于选定的成像参数,研究了$ w(r) $的分布。 对于随机分布的观测值和 $r_{max}$ 的平滑半径,权重的中位数 [中位数 (w)] 只是在半径处评估的光束(加权)函数,该半径将平滑区域一分为二,即 $w(r_{max} / \sqrt{2})$。对于 $r_ {max} =6 arcmin$;中值$(w) =1.28$。网格化 HIPASS 图像期间的测试显示该值附近的分布非常窄,表明输入光谱在天空中几乎是随机分布的。

参考

[1]:修改了一些专业名词明显翻译不当的问题

[2]:The HI Parkes All Sky Survey: southern observations, calibration and robust imaging, Monthly Notices of the Royal Astronomical Society, Volume 322, Issue 3, April 2001, Pages 486–498,https://doi.org/10.1046/j.1365-8711.2001.04102.x