前面介绍了Short TTI可以是2个OFDM或4(3)个OFDM符号,时域上变短了,相应的PUCCH、RS及调度等也需改变。
sPUCCH的负载大小
目前,传统PUCCH支持多种格式:PUCCH Format1a、1b、2、2a、2b、3、4和5。由于采用了几种PUCH格式来支持不同的UCI有效载荷大小,对于特定sTTI长度,应考虑至少两种sPUCCH格式:
- ·一种格式(称为sPUCCH format 1)具有一个或两个HARQ-ACK位或一个SRI位,可以提供良好的覆盖率。如果将ZC序列应用到sPUCCH格式1,那么可以在同一时间频率资源上复用多个sPUCCH。
- ·另一种格式(称为sPUCCH format 2)具有较大的UCI有效载荷大小,例如CA、TDD或UL和DL的不同TTI长度的多个HARQ-ACK位。
现有PUCCH的长度为1ms,不适合降低时延。目前,传统PUCCH支持TTI内跳频以利用频率分集。对于PUCCH格式1a、1b、2、2a、2b和3,每个PUCCH在系统带宽的两个相对边缘处由两个0.5ms RB组成。对于PUCCH格式4和5,它是类似于PUSCH的结构,在eCA中引入的系统带宽的两个相对边缘也有两个0.5ms。因此,为了提高sPUCCH的覆盖率,还应考虑TTI内跳频。
考虑到TTI内跳频,两个示例如图1所示。对于sPUCCH格式1,DMRS开销与PUCCH format 1a和1b相同。对于sPUCCH format 2,需要报告更多的UCI位,导致假设的DMRS符号更少。
在不进行TTI内跳频的情况下,对于HARQ-ACK响应,可以重用每个时隙中的PUCCH格式1a、1b、3、4或5的结构。对于CSI,可以重用每个时隙中的PUCCH格式2、2a和2b的结构。然而,由于PUCCH的缩短,发送的CSI比特的数目将减少,这意味着需要额外的改进。
TTI内跳频可以提高PUCCH性能,因此应考虑具有TTI内跳频的4个符号PUCCH结构。图2中显示了一个示例,其中图案化符号用于DMRS。利用这种结构,PUCCH DMRS开销与传统PUCCH 1a和1b的开销相同。对于UE,第四个符号中的RS由sTT0和sTTI1共享,第11个符号中的RS由sTT2和sTTI3共享。对于两个不同的UE,可以将两个具有不同循环移位的RS放置在同一个符号中。
由于在sTTI内配置了两个sPUCCH频带,因此每个sPUCCH频带需要一个DMRS。对于sPUCCH格式1和sPUCCH格式2,配置了相同的时间结构。
对于2个符号PUCCH,如图3所示的简单结构是一个符号用于PUCCH DMRS,另一个符号用于PUCCH的控制部分。为了在UL中保持单载波特性,不能为2符号sPUCCH配置TTI内跳变。然而,PUCCH的覆盖被降低,因此短TTI只能被配置为小区中心的UE。
为了提高PUCCH性能,提出了伪2符号PUCCH概念。如图4和图5所示,PUCCH占用2个符号,PUCCH DMRS位于PUCCH的前面。由于DMRS不用于承载HARQ-ACK响应,UE在完成PDSCH解码之前可以准备DMRS,因此可以提前准备和传输PUCCH-DMRS。该方法在不增加处理时间的同时,可以提高PUCCH性能。
当UE有多个连续PUCCH时,伪2符号PUCH不能始终配置,如图3(a)所示。当有两个不同UE的连续PUCCH时,如图3(b)所示,UE2的PUCCH DMRS与UE1的PUCCH DMRS重叠。在这种情况下,可以配置不同的循环移位。
因此,如果上行覆盖不是问题,则可以配置2符号PUCCH,否则应该配置具有非连续传输的伪2符号PUCCH,4符号PUCCH。
至少对于MBSFN子帧,应该支持基于DMRS的传输模式。考虑到小数据包和大数据包都能从时延减少中获益,多层传输是sTTI的一个重要方案。如果DMRS开销是可接受的,那么用于sTTI的基于DMRS的TM的最大传输层数应该与传统层数一样大。
对于小于或等于4OS的TTI长度,可能需要新的DMRS设计。目前,有两种候选的DMRS模式可用于sTTI传输,一种是重用传统的DMRS模式,其中在时域中对多个层进行CDMed,可能会改变DMRS放置在一个sTTI的早期符号中的方式,另一种是华为提出的DMRS模式,将DMRS放置在sTTI的第一个符号中,并且在频域中对多个层进行CDMed。图6显示了2OS sTTI的模式示例。传统模式的最大层数为2层,而所提出的模式可以支持4层复用。因此,需要更多的DMRS集来支持传统模式的更多层。表1提供了一个TTI中候选DMRS模式的开销。
从表1可以看出,所提出的DMRS模式可以在可接受的开销下支持多达8层的传输。
在仿真中,TTI长度为2OS,并且考虑了一个子帧中的一个目标sTTI。如图6所示,目标sTTI包括用于传统DMRS模式的符号12和13,而对于提议的DMRS模式评估符号2和3。
表2总结了所有评估情景实现10%BLER所需的SNR。
短TTI的RS设计将影响用户的开销和信道估计性能,从而影响时延减少增益。
sPUSCH DMRS的设计有两种备选方案:
- 同一子帧内多个短TTI共享的DMRS符号
- 每个sPUSCH中包含的DMRS
对于TTI长度大于或等于4(3)个符号且开销可接受的情况,可以考虑每个sTTI的自包含DMRS。图7(a)给出了4(3)个符号的自包含DMRS模式。对于2符号sTTI,可以考虑多个sTTI在同一子帧内共享一个DMRS码元以减少RS开销。例如,图7(b)显示了一个DMRS由四个2符号sTTI共享的结构。请注意,给定的模式中包含4个sTTI或8个符号。
为了评估上述DMRS结构对sPUSCH的性能,考虑了2符号sTTI和4(3)符号sTTI。对于4(3)符号sTTI,将一个sTTI,例如图7(a)中的sTTI 1作为目标sTTI。对于2符号sTTI,图7(b)假设四个sTTI共享一个DMRS的模式,并且sTTI 0到sTTI 3是评估DMRS和数据符号之间的时间距离影响的目标sTTI。
对于低速情况,多个sTTI可以共享一个DMRS,以减少RS开销,提高吞吐量;而对于高速情况,DMRS应该以高密度传输,以提高信道估计精度。gNB应有权为2符号sTTI决定UE发送DMRS的位置,以适应不同的场景。
DMRS共享场景的相位连续性问题,即一个UE的DMRS符号和sTTI之间存在gap,可以参考前面的结论,因为MTC已经讨论过这个问题。如果UE暂停一个SC-FDMA符号中的传输(由于小区特定的SRS),并且如果UE发射功率和UE RF中心频率没有改变,则在SC-FDMA符号之后恢复传输,则相位连续性不应成为问题。此外,对于多个连续子帧,如果gap的持续时间是很少的符号,则相位是连续的。如果间隔的持续时间等于或延伸一个子帧,则相位可以是连续的,也可以不是连续的。因此,对于不同的UE,多个sTTI共享一个DMRS符号似乎是可行的。
除了由具有相同频率资源分配的多个短TTI共享的一个DMRS符号之外,多个UE的不等频率资源分配还可以共享相同的DMRS符号以减少开销。如图8所示,用于UE 1的DMRS 1和用于UE 2的DMRS 2被放置在一个符号中,为了保持共享DMRS区域中的正交性,推荐用于UE 1和UE 2复用的梳状RS结构。
在上述评估中,假设了理想的时间和频率同步。然而,如果为每个调度的短TTI假设一个用于DMRS传输的OFDM符号,则gNB难以估计频率偏移,因为它需要具有特定时间距离的至少两个成对的DMRS。如果不进行频偏估计或使用历史频偏,残余频率误差将影响解调性能。这个问题对于PUCCH可能不是很严重,因为QSPK调制用于对频率误差不敏感的PUCCH。但是,当UE处于高速或高调制阶的情况下,例如UE速度为60km/h,PUSCH使用16QAM甚至64QAM时,由于缺少精细的频偏补偿,估计会导致性能损失。因此,至少在高速或高调制阶的情况下,应考虑频偏估计。一个简单的解决方案是,UE可以快速切换以发射正常子帧,以帮助gNB估计频率偏移。另一个解决方案是gNB决定发送DMRS的UE的位置。
PDSCH和PUSCH的TTI长度相同
在sPDSCH和sPUSCH的TTI长度相同的情况下,UL调度时机很简单。对于子帧n的sTTI i中的UL授权,其调度的PUSCH在子帧n+k的sTTI j中传输。k、i和j的值取决于UE的处理时间。如果假设UE和gNB的处理时间与TTI长度成比例关系,则在发送UL许可之后,PUSCH被发送4TTI。图9和图10中显示了两个示例。
sPDSCH和sPUSCH的TTI长度不同
5G中上下行的TTI长度可以不同。在这种情况下,当前的UL调度timing规则是不合适的。对于子帧n的DL sTTI i中的UL授权,其调度的PUSCH在子帧n+k的UL sTTI j中传输,其中DL sTTI i的长度可以不同于UL sTTI j的长度。可以考虑两种选择:
- 一种选择是UL授权仅在子帧内的一些DL TTI中传输。图11和表3显示了一个示例。
- 另一个选项是UL授权可以在子帧内的任何DL TTI中传输。通过这种方法,UL-Grant的配置更加灵活。图12和表4中显示了一个示例。
CSI 测量
测量资源由FDD的单个下行链路子帧n-k定义,其中n是报告子帧。随着短TTI传输的引入,一个UE需要向gNB报告快速的CSI信息以帮助调度短TTI传输,可以考虑在减少P-CSI报告间隔的同时减少P-CSI的测量时间。仅减少报告间隔的性能增益小于同时减少测量时间和报告间隔的性能增益,因为当测量资源距离此报告时间太远时,实际信道对应的CSI会迅速变化,如果一个sTTI UE可以为DL和UL支持不同的TTI长度,由于UL和DL不再对称,测量资源将被重新定义。
如果短TTI UE支持基于DMRS的传输,那么也可以支持基于CSI-RS的CSI测量。假设参考信号传输模式的间隔足够小以反映信道的变化,当CSI反馈报告可以跟踪无线信道时,精确的链路自适应可以提高下行用户的吞吐量。然而,如果CSI-RS传输间隔太大以至于CSI可能只跟踪慢信道波动而不是快速信道信息,那么在短TTI中引入快速CSI报告可能对性能增益没有什么帮助。例如,可以引入CSI-RS的小间隔。5次缩短TTI,这显然会带来很大的开销。因此,在考虑快速CSI测量和报告时,需要研究CSI-RS开销的降低问题。
UE使用高层配置的报告模式在PUCCH或PUSCH上报告不同的CSI组件(CQI、PMI、PTI、CRI或RI),下面将讨论如何在短时间内报告CSI反馈。
上报时机
gNB可以基于小区负载、覆盖范围、服务类型、网络拓扑和UE位置等自适应地配置TTI长度。例如,对于关键服务,可以配置2个符号TTI或4(3)符号TTI。一般来说,考虑到上行TTI缩短会导致覆盖率降低,下行PDSCH的TTI长度可以小于PUCCH的TTI长度。然后,对于TTI缩短,CSI反馈可以发生在上行sTTI而不是子帧中。
对于非周期CSI(A-CSI),直到Rel13,在subframe i中接收到触发DCI的一个CSI之后,UE将在subframe i+k中报告A-CSI信息,其中k在FDD中为4,或者当来自上行链路DCI格式的CSI请求字段被设置为触发A-CSI报告时,取决于TDD UL/DL配置。简言之,一种可能的方法是CSI触发和A-CSI报告之间的间隔取决于上行链路授权时机。
对于周期CSI(P-CSI),gNB可以半静态地配置报告间隔。通过减少TTI长度,一种简单的方法是按TTI长度的比例调整P-CSI报告期。当DL和UL的TTI长度可以不同时,可以考虑P-CSI报告期的DL和UL TTI长度。
CSI报告开销
对于单个服务小区,对于PUSCH模式3-2的100 RB的下行带宽,a-CSI报告的最大大小是112bit,对于CSI进程,P-CSI报告的最大大小是11位,一个CSI触发DCI最多可以触发32个CSI进程的报告。那么32个载波的A-CSI的最大有效负载大小将是32×112=3584比特,并且32个载波的P-CSI的最大有效负载大小将是32×11=352比特。
然而,对于可用时间资源小于1ms TTI的短TTI,较大的负载大小将进一步限制短TTI的应用。对于使用(e)CA的短TTI传输,可以减少CSI开销。可以有几个增强的方向:
1) 由于在一个短TTI中UE的调度粒度的频域可能变大,因此子频带数目可以在短TTI中减少以减少CSI的开销。
2) 由于CQI、PMI、PTI、CRI或RI有不同的性能要求或带来不同的收益,CSI报告内容应考虑信息的重要性和必要性。一方面,RI、CRI和PTI反馈可以保持在一个时间间隔内,因为这些信息会经常改变。另一方面,CQI和PMI需要频繁的反馈,因为它们可以从快速链路自适应中获得性能增益。因此,需要频繁更新的CSI信息在sTTI中的反馈周期较短,而在sTTI中的反馈周期较长是合理的。因此,在不同时段或不同TTI长度中报告CSI将减少CSI的开销,特别是对于(e)CA中的短TTI。
相同TTI长度的下行HARQ timing
在DL和UL的TTI长度相同的情况下,DL HARQ时机是简单的。对于子帧n-k的sTTI i中的下行传输,HARQ-ACK反馈在子帧n的sTTI j中传输。k、i和j的值取决于UE的处理时间。如果假设UE和gNB的处理时间与TTI长度成比例关系,则HARQ-ACK反馈在PDSCH发送后4 TTI被发送。例如,如图13所示,在FDD中,如果在子帧n-1的sTTI i中发送4或3符号PDSCH,则用于PDSCH的HARQ-ACK反馈将在子帧n的sTTI i中。
处理时间缩短
图14显示gNB和UE处理延迟和HARQ RTT的基线假设,其中,对于gNB处理和调度假设1.5 TTI,并且对于UE处理也假设1.5 TTI。
但是,在上面的图中,所有的处理延迟都是根据TTI长度进行缩放的。事实上,如果网络中有拉远站点,则存在一些延迟,例如TA或CPRI延迟,不应减少TTI长度。图15给出了考虑TA的eNB和UE处理时间的图示。
首先考虑UE处理时间。UE侧的处理时间可以分为三部分,如图15所示,D1表示TTI传输的持续时间,D2表示用于pdcch和PDSCH的子帧n的处理时间,该子帧n用于DL的pdcch和PDSCH的解调,eNB调度PDSCH至UE,或者如果UE具有要发送的上行数据,则对UL授权进行解码,D3表示PUCCH或PUSCH的准备时间。d1明显可以用TTI长度因子来缩放。对于D2,为了减少PDCCH处理时间并避免额外的UE能力要求,优选将最大PDCCH盲解码保持在子帧中几乎与之前相同,然后可以假设PDCCH处理时间可以按比例减少。由于信号的持续时间短,可以正常地缩短短TTI的解调和数据准备的处理时间。
注意,对于上行链路,应提前发送信号以对准eNB侧的到达时间,这意味着TA应包括在UE处理时间中。因此,TA越大,UE侧的可用处理时间越短。表4列出了小区半径分别为5km、10km、30km和100km时,最大TA值与候选TTI长度的百分比,在一定程度上反映了TA值的影响。
由于TA将在一定程度上影响UE侧的实际处理时间,因此一种选择是限制最大TA值以减少时延。但是,最大TA表示短TTI支持的小区半径,限制它将限制部署场景。另一个选择是允许UE特定的HARQ处理时延来适应不同的UE能力,因此每个UE可以尽最大努力实现延迟减少增益。
然后考虑eNB处理时间。eNB侧的处理时间也可以分为三部分,如图15所示,D4表示上行TTI传输的持续时间,D5表示PUCCH或PUSCH解调的处理时间,D6表示eNB调度PDCCH或PDSCH的准备时间。与UE类似,用于解调短TTI的传输和处理时间可以与缩短的TTI长度成比例地减少。对于下行传输准备,如果TTI长度非常短,则数据准备时间与TTI长度的比率可能不是线性的,考虑到eNB被假定在一个TTI中具有很大的调度灵活性。然而,eNB调度取决于实现算法,这里假设eNB调度的处理时间仍然与TTI长度成比例地减少。
直截了当地,处理时间的减少可能仍然与相应的TTI长度成比例。例如,假设DL TTI长度为142.8us(2个符号),上行TTI长度为250us(4个符号),不存在TA影响,则UE总处理时间为142.8+142.8*1.5+250*1.5=732us,eNB总处理时间为250+250*1.5+142.8*1.5=839.2us。