Twice Labels Number Estimation Algorithm Based on Gaussian Fitting and Chebyshev Inequality
-
摘要: 针对射频识别技术(RFID)系统中现有标签数量估计算法存在的估计误差大、识别时延长、时间复杂度高的问题,该文提出一种基于高斯拟合与切比雪夫不等式的标签数量2次估计算法(TLNEGC)。首先根据碰撞因子与碰撞时隙比例的关系建立碰撞模型,采用高斯函数对碰撞模型中的离散数据点进行拟合逼近获得高斯估计模型;然后利用高斯估计模型初次估计标签的数量,根据初次估计的结果判断是否需要进行2次估计,2次估计是利用切比雪夫不等式对估计区间进行2次搜索以获得最佳估计值。MATLAB仿真分析表明,该文所提TLNEGC算法的平均估计误差和总时间消耗明显低于现有的高精度标签估计算法,同时具有较低的时间复杂度和较高的稳定性。Abstract: In order to solve the problems of large estimation error, prolonged identification and high time complexity, which exist in tag quantity estimation algorithm in Radio Frequency IDentification (RFID) system, The Twice Labels Number Estimation algorithm based on Gaussian fitting and Chebyshev inequality (TLNEGC) is proposed. Firstly, a collision model is established based on the relationship between the collision factor and the collision time slot ratio, and a Gaussian estimation model is obtained by fitting the Gaussian function to the discrete data points. Afterward, the Gaussian estimation model is used to initially estimate the number of labels, and then according to the results of the initial estimation, judge whether a second estimation is required. The second estimation is performed by using Chebyshev's inequality to search the estimation interval twice to obtain the best estimate. The MATLAB simulation analysis indicates that the average estimation error and total time consumption of the TLNEGC algorithm are significantly lower than those of existing high-precision label estimation algorithms, and it also has lower time complexity and higher stability.
-
1. 引言
射频识别技术(Radio Frequency Identification, RFID)是一种通过阅读器在短时间内快速识别标签的非接触性识别技术[1],当多个标签处于同一个阅读器的工作范围时,多个标签的应答信号会相互干扰导致阅读器无法正常读取标签内信息,这称为标签碰撞[2]。标签防碰撞问题是RFID系统中多标签识别的关键问题[3]。RFID系统中最常使用的防碰撞算法是ALOHA算法[4],基于ALOHA的算法包括时隙ALOHA(Slotted Aloha, SA)算法[5]、帧时隙ALOHA(Frame Slotted Aloha, FSA)算法[6]、动态帧时隙ALOHA(Dynamic Frame Slot Aloha, DFSA)算法[7]以及其他改进算法[8,9]。
DFSA算法是目前比较主流的防碰撞算法,已经被一些RFID标准(ISO 14443-3, ISO 18000-6C和EPC Class1 Gen2)采用[10]。DFSA 算法的性能主要从标签数量估计和帧长度设定两个维度进行分析。文献[11]证明当帧长等于RFID系统中待识别标签的数量时,RFID系统达到最高吞吐率。准确地估算待识别标签的数量,尤其是在大规模应用场景下快速估算标签数量,是提高防碰撞算法性能的关键。
目前的标签数量估计算法主要分为两类,一类是基于系数的解析式估计算法[12-14],另一类是根据目标函数进行最优值搜索的区间估计算法[15-17]。
文献[12]提出Low Bound估计算法,假定碰撞时隙中的平均标签量为2,文献[13]提出Schoute算法,假定碰撞时隙中的平均标签量为2.39。文献[14]证明当RFID系统中待识别标签数量是帧长3倍以上时,碰撞时隙内的平均标签数远多二者假定的标签量,因此Low Bound算法和Schoute算法在待识别标签数远大于帧长时估计误差相对较大。为此文献[14]提出一种基于分段解析式的标签数量估计算法,根据碰撞时隙比例的不同分段地调整平均标签数量的数值,该算法相对于Low Bound算法、Schoute算法能更好地适应标签数量的动态变化,但是分段处的跳跃间断点会导致估计值出现大波动,而且当碰撞时隙比例较大时不能及时调整碰撞因子值会导致大的估计误差。
文献[15]提出了基于切比雪夫不等式的区间估计算法,利用切比雪夫不等式进行标签估计。文献[16]提出了基于最大后验概率的区间估计算法,将估计区间内最大后验概率对应的标签量作为待识别标签数量的估计值。上述两种算法相对基于系数的解析式估计算法大幅提高了估计精度。但是算法分析复杂,且估计稳定性差。文献[17]提出基于粗精2次估计的RFID标签数目估计算法,该算法对待识别标签量进行粗精两次估计,在降低一定时间复杂度的同时提升了估计精度,但是增加了额外的时隙消耗;同时该算法在精估计时存在局部最优解的问题。
由上述分析可知,基于系数的解析式算法的性能取决于碰撞时隙中的平均标签数量,具有计算量小、估计精度低的特点;基于区间的估计算法在估计区间内逐一搜索寻找最优估计量,具有计算量大、估计精度高的特点。因此本文将上述两类算法的优点进行结合,提出一种基于高斯拟合与切比雪夫不等式的标签数量2次估计算法(Twice Labels Number Estimation algorithm based on Gaussian fitting and Chebyshev inequality, TLNEGC)。
2. TLNEGC算法
TLNEGC算法首先根据碰撞因子与碰撞时隙比例的关系建立碰撞模型,采用高斯函数对碰撞模型中的离散数据点进行拟合逼近获得高斯估计模型;然后利用高斯估计模型初次估计标签的数量,根据初次估计的结果判断是否需要进行2次估计,2次估计是利用切比雪夫不等式对估计区间进行2次搜索以获得最佳估计值。
2.1 高斯拟合模型
文献[9]证明了碰撞时隙的比例、碰撞因子之间的关系不受帧长影响。为获得碰撞时隙比例
F 与碰撞因子B 的关系,参照文献[14]采用蒙特卡罗方法[18]对阅读器的读取过程进行模拟。模拟中的参数设置如下:初始帧长取值128, 256, 512,标签数量范围设置为[100, 1000],实验次数为3000次。
仿真结果如图1所示。其中横轴是碰撞时隙比例
F ,纵轴是碰撞因子B 。图1中的蒙特卡罗数据点集分布满足高斯分布在X负半轴的分布特征,因此采用1维高斯函数对图1中的蒙特卡罗数据点集 (
Bi ,Fi ), i=1, 2, 3, ···, 3000进行拟合。拟合形式如式(1)所示F=Fmaxexp[−(B−Bmax)2S] (1) 其中,待估参数
Fmax ,Bmax 和S 分别为目标曲线的峰值、峰值位置和半宽度信息。式(1)两边取自然对数,可得出式(2)Y=MB2+NB2+K (2) 其中,
Y=−ln(F) ,M=1/S2 ,N=−2Bmax/S2 ,K=B2max/S2−ln(Fmax) 。根据最小二乘原理,参数M ,N ,K 由式(3)确定[¯B2¯B1¯B3¯B2¯B¯B4¯B3¯B2][MNK]=[¯B¯BB¯B2B] (3) 其中,参数
¯Bj ,¯BmY 由式(4)确定¯Bj=3000∑i=1Bji/3000,j=1,2,3,4¯BmY=3000∑i=1BmiYi/3000,m=0,1,2} (4) 可求解出参数
Fmax ,Bmax 和S ,如式(5)所示Fmax=exp(N2/4M−K)Bmax=−N/2MS=√1/M} (5) 则高斯拟合曲线的表达式为式(6)
B=4.415×exp(−((F−5.3)/0.73)2)+9376×exp(−((F−27.5)/9.5)2) (6) 根据高斯函数对图1进行拟合得到的高斯拟合曲线如图2所示。从图2可以看出式(6)给出的拟合曲线具有很好的拟合度。
2.2 初次估计解析方程
根据式(6)的拟合曲线,阅读器在一次读取后根据反馈信息获取
B 的值,从而估计出标签数量Ne (此时为初次估计值)可由式(7)所示Ne=B×C+S (7) 其中,
C 为碰撞时隙数,S 为成功时隙数。当初次估计值
Ne 小于帧长L 时,帧长大于实际标签量,由多项分布可知,此时碰撞时隙数较少,成功时隙数较多,此时式(7)给出的解析式具有非常好的拟合度的估计精度,可直接将估计值输出为最佳估计值。当初次估计值Ne 大于帧长L 时,帧长小于实际标签量,由多项分布可知,此时碰撞时隙数较多,成功时隙数较少,Ne 的精确度很大程度受到B 的影响,那么需要对Ne 进行2次估计。2.3 2次估计
标签在响应阅读器的过程中随机选择一个时隙应答,根据数理统计知识可知,
r 张标签选择同一时隙的概率应满足多项分布。空闲时隙概率Pe 、成功时隙概率Ps 、碰撞时隙概率Pc 可通过式(8)所示的公式计算得到。BN,p(r)=CNr(p)r(1−p)N−r (8) 其中,
P=1/L ,N 为待识别标签数量。r=0 表示空闲时隙,r=1 表示成功时隙,r>1 表示碰撞时隙。阅读器对标签的每一帧读取过程是独立的多次实验(每一帧的每一时隙为一次独立实验,每次实验的结果为空闲时隙、成功时隙、碰撞时隙的一种),此碰撞场景适用于采用切比雪夫不等式进行估计。利用切比雪夫不等式对
Ne 的初次估计结果进行估计,该方法的基础是随机试验的结果应接近于期望值。为此,设定的一个估计区间Δ ,在Δ 内计算每一个标签量n 对应的每个时隙的期望,计算每个时隙期望与实际值之间的切比雪夫距离D ,在Δ 内搜索出一个标签量n 使得切比雪夫距离D 最小,该标签量n 即最佳估计值。切比雪夫距离D 由式(9)所示D(L,ce,cs,cc)=ArgminΔ;n|(ESC)−(cecscc)| (9) 其中,
E ,S ,C 是实际读取结果中的空闲时隙数、成功时隙数、碰撞时隙数,ce ,cs ,cc 是估计区间Δ 内每一个标签量n 对应的空闲时隙期望、成功时隙期望、碰撞时隙期望,ce ,cs ,cc 可由各时隙概率和帧长L 得到。区间
Δ 的设置对降低算法复杂度,保证算法估计精度至关重要。由于切比雪夫不等式在区间过大时存在多最优解问题,因此区间Δ 过大不仅不能提高估计精度反而会增加算法的时间复杂度,区间Δ 过小则不能得到最优估计量。图1中的数据点主要集中于初次估计值的6%的区间内,因此考虑以初次估计值为中心,初次估计值的6%为半径的区间设置为Δ 。2.4 TLNEGC算法流程
TLNEGC的算法流程如表1所示。
表 1 TLNEGC的算法流程(1) Initialization L (2) Read ESC (3) F←C/L (4) B←Gaussian(F) (5) Ne←S+BC (6) If Ne<Lthen (7) Output Ne (8) Else if (9) Initialization L=Ne (10) For i from 0.94N to 1.06N (11) ce←L(1−1/L)Ne (12) cs←N(1−1/L)Ne−1 (13) cc←L−ce−cs
(14) Output D(L,ce,cs,cc)←ArgminΔ;n|[E,S,C]−
ce,cs,cc|(15) End for (16) End if 3. 算法仿真与分析
使用Matlab软件进行仿真实验,从估计误差、时间复杂度、总时隙数消耗、总时间消耗、稳定性5个角度进行对比。
3.1 估计误差
设
ε 为估计误差率,Ne 为标签数量的估计量,N 为RFID系统中实际存在的标签数量,那么ε 可由式(10)计算ε=|Ne−N|/N (10) 对本文提出的TLNEGC算法和现有的Low Bound算法、Schoute算法、最大后验概率算法、粗精2次估计算法的标签数量估计误差率进行仿真,仿真结果如图3所示。图3中的横坐标为标签数量,取值范围为[100, 1000],纵坐标为估计误差率。
由图3可知,TLNEGC算法误差曲线整体平缓,误差均值为2.2%,最大估计误差不超过4%。Low Bound算法、Schoute算法、算法的估计误差率随着标签数量的增多迅速上升。最大后验概率算法的估计误差比Low Bound算法、Schoute算法更低,但明显高于TLNEGC算法而且误差曲线起伏大。粗精2次估计算法在估计精度、估计稳定性方面优于Low Bound算法、Schoute算法、最大后验概率算法,但估计误差仍然高于TLNEGC算法。
由此可知,TLNEGC算法相比现有算法的估计误差更低、稳定性更好。其原因在于TLNEGC算法采用了2次估算,第1次是动态调整解析式系数以降低估计误差,第2次是利用切比雪夫不等式对初次估计的结果进行2次搜索以提高估算精度。
3.2 时间复杂度
使用算法的运行时间来衡量时间复杂度。对本文提出的TLNEGC算法和现有的Low Bound算法、Schoute算法、最大后验概率算法、粗精2次估计算法的运行时间进行仿真,仿真结果如图4所示。图4中的横坐标为标签数量,取值范围为[100, 1000],纵坐标为运行时间。
由图4可知,本文提出的TLNEGC算法的运行时间与标签量的增长呈正相关,平均运行时间为0.0054 s;时间复杂度为
O(n) 。Low Bound算法、Schoute算法的运行时间与标签数量的增长基本无关,时间复杂度为O(1) ,平均运行时间为0.0029 s。最大后验概率算法的运行时间随着标签的增加呈指数增长,算法的时间复杂度为O(n2) ,平均运行时间为0.346 s。粗精2次估计算法的运算时间与标签量的增长呈正相关,时间复杂度也为O(n) ,平均运行时间为0.012 s。由此可知,TLNEGC算法的运行时间略长于系数类估计算法,但是明显低于其他高精度区间类估计算法。其原因在于TLNEGC估计算法在初次估计时只做1次乘法,在利用切比雪夫不等式进行2次估计时也只做0.12
n 次乘法,因此总体时间复杂度仍能保持在O(n) 。3.3 总时隙数消耗
为了验证TLNEGC算法的识别效率,以识别全部标签所需的总时隙数消耗为衡量指标,对本文提出的TLNEGC算法和现有的Low Bound算法、Schoute算法、最大后验概率算法、粗精2次估计算法的运行时间进行仿真,仿真结果如图5所示。图5中的横坐标为标签数量,取值范围为[50, 250],纵坐标为识别所需总时隙数。
由图5可知,TLNEGC算法的总时隙数消耗曲线平直,平均消耗414个时隙就能完成识别。Low Bound算法的总时隙数消耗曲线起伏较大,平均消耗602个时隙就能完成识别。Schoute算法的总时隙数消耗曲线同样起伏较大,平均消耗564个时隙能完成识别。最大后验概率算法总时隙消耗曲线平缓,平均消耗458个时隙能完成识别。粗精2次估计算法总时隙消耗曲线总体平缓,平均消耗834个时隙完成识别。
由此可知TLNEGC算法相比现有算法的总时隙数消耗更少。这是由于TLNEGC算法估计精度高,有效地减少了时隙消耗。
3.4 总时间消耗
为了分析TLNEGC算法的总时间消耗,以识别全部标签所需的总时间消耗为衡量指标,对本文提出的TLNEGC算法和现有的Low Bound算法、Schoute算法、最大后验概率算法、粗精2次估计算法的运行时间进行仿真,仿真结果如图6所示。图6中的横坐标为标签数量,取值范围为[100, 500],纵坐标为识别所需总时间。
由图6可知,TLNEGC算法的总时间隙数消耗曲线平直,平均消耗0.43s就能完成识别。Low Bound算法的总时间隙数消耗曲线较为平直,平均消耗0.56 s完成识别。Schoute算法的总时间隙数消耗曲线同样较为平直,平均消耗0.73 s完成识别。最大后验概率算法的总时间消耗曲线陡峭,平均消耗0.78 s能完成识别。粗精2次估计算法的总时间隙数消耗曲线较为平直,平均消耗0.94 s完成识别。
由此可知TLNEGC算法相比现有算法的总时间消耗更低。这是由于TLNEGC算法有较高的估计精度,有效地减少估计时隙消耗。同时TLNEGC算法运行时间短,减少了估计时间的消耗。
3.5 稳定性
由于存在捕获效应,部分碰撞时隙会被阅读器识别为成功时隙,会引起标签的丢失,导致碰撞时隙和成功时隙与实际情况不符。本节对捕获效应下算法的估计结果进行仿真对比,其中捕获效应发生的概率设置为0.15。
对捕获效应下TLNEGC算法和现有的Low Bound算法、Schoute算法、最大后验概率算法、粗精2次估计算法的标签数量估计误差率进行仿真,仿真结果如图7所示。图7中的横坐标为标签数量,取值范围为[100, 1000],纵坐标为估计误差率。
计算估计误差的均方差。TLNEGC算法的均方差为0.0086。Low Bound算法、Schoute算法的均方差分别是0.2376, 0.2304。最大后验概率算法的均方差为0.1550。粗精二次估计算法的均方差为0.0174。
由此可知在捕获效应的场景下,TLNEGC算法估计误差的均方差低于现有估计算法,稳定性更好。其原因在于TLNEGC算法在第1次估算时动态调整解析式系数以降低估计误差,在第2次估算时利用切比雪夫不等式对初次估计的结果进行2次搜索保证了估计的稳定性。
4. 结论
针对RFID系统中标签数量估计算法存在的估计精度不高、识别时延长、时间复杂度高的问题,本文提出一种基于高斯拟合与切比雪夫不等式的标签数量二次估计算法TLNEGC。仿真结果表明,TLNEGC算法在大规模标签场景下的平均估计误差为2.2%,平均消耗414个时隙完成标签数量识别,完成识别平均时间消耗0.43 s,明显优于现有标签数量估计算法且具有较高的稳定性。本文所提TLNEGC算法具有估计精度高、时间复杂度低的优点,对于标签数量识别具有一定的应用价值。
-
表 1 TLNEGC的算法流程
(1) Initialization L (2) Read ESC (3) F←C/L (4) B←Gaussian(F) (5) Ne←S+BC (6) If Ne<Lthen (7) Output Ne (8) Else if (9) Initialization L=Ne (10) For i from 0.94N to 1.06N (11) ce←L(1−1/L)Ne (12) cs←N(1−1/L)Ne−1 (13) cc←L−ce−cs
(14) Output D(L,ce,cs,cc)←ArgminΔ;n|[E,S,C]−
ce,cs,cc|(15) End for (16) End if -
[1] KHADKA G, AREFIN M S, and KARMAKAR N C. Using Punctured Convolution Coding (PCC) for error correction in chipless RFID tag measurement[J]. IEEE Microwave and Wireless Components Letters, 2020, 30(7): 701–704. doi: 10.1109/LMWC.2020.2994189 [2] BUFFI A, MOTRONI A, NEPA P, et al. A SAR-based measurement method for passive-tag positioning with a flying UHF-RFID reader[J]. IEEE Transactions on Instrumentation and Measurement, 2019, 68(3): 845–853. doi: 10.1109/TIM.2018.2857045 [3] 袁莉芬, 杜余庆, 何怡刚, 等. 可并行识别的分组动态帧时隙ALOHA标签防碰撞算法[J]. 电子与信息学报, 2018, 40(4): 944–950. doi: 10.11999/JEIT170654YUAN Lifen, DU Yuqing, HE Yigang, et al. Grouped dynamic frame slotted ALOHA tag anti-collision algorithm based on parallelizable identification[J]. Journal of Electronics &Information Technology, 2018, 40(4): 944–950. doi: 10.11999/JEIT170654 [4] BABICH F and COMISSO M. Impact of segmentation and capture on slotted aloha systems exploiting interference cancellation[J]. IEEE Transactions on Vehicular Technology, 2019, 68(3): 2878–2892. doi: 10.1109/TVT.2019.2894705 [5] JIA Dia, FEI Zesong, and ZHANG Yasheng. Irregular repetition slotted ALOHA with total transmit power limitation[J]. Information Sciences, 2019, 64(2): 129301. doi: 10.1007/s11432-019-2728-x [6] FERREIRA H P A, ASSIS F M, and SERRES A R. Novel RFID method for faster convergence of tag estimation on dynamic frame size ALOHA algorithms[J]. IET Communications, 2019, 13(9): 1218–1224. doi: 10.1049/iet-com.2018.5506 [7] NGUYEN C T, NGUYEN V D, and PHAM A T. Tag cardinality estimation using expectation-maximization in ALOHA-Based RFID systems with capture effect and detection error[J]. IEEE Wireless Communications Letters, 2019, 8(2): 636–639. doi: 10.1109/LWC.2018.2890650 [8] 席雯. 捕获效应下RFID防碰撞算法的研究与应用[D]. [硕士论文], 北京交通大学, 2018.XI Wen. Research and application of RFID anti-collision algorithm coping with capture effect[D]. [Master dissertation], Beijing Jiaotong University, 2018. [9] WANG Zuliang, ZHANG Ting, FAN Linyan, et al. Dynamic frame-slotted ALOHA anti-collision algorithm in RFID based on non-linear estimation[J]. International Journal of Electronics, 2019, 106(11): 1769–1783. doi: 10.1080/00207217.2019.1625968 [10] KUMAR D, MONDAL S, KARUPPUSWAMI S, et al. Harmonic RFID communication using conventional UHF system[J]. IEEE Journal of Radio Frequency Identification, 2019, 3(4): 227–235. doi: 10.1109/JRFID.2019.2925527 [11] ALVAREZ-NARCIANDI G, MOTRONI A, PINO M R, et al. A UHF-RFID gate control system based on a recurrent neural network[J]. IEEE Antennas and Wireless Propagation Letters, 2019, 18(11): 2330–2334. doi: 10.1109/LAWP.2019.2929416 [12] SHAHZAD M and LIU A X. Fast and accurate estimation of RFID tags[J]. IEEE/ACM Transactions on Networking, 2014, 23(1): 241–254. doi: 10.1109/TNET.2014.2298039 [13] HAMMAD M, SHAHID N, NATHIRULLA M, et al. Improved efficient RFID tag estimation scheme[J]. International Journal of Computer Applications, 2012, 47(17): 16–19. [14] CHOI S S and SANGKYUNG K. A dynamic framed slotted ALOHA algorithm using collision factor for RFID identification[J]. IEICE Transactions on Communications, 2009, E92(3): 1023–1026. doi: 10.1587/transcom.E92.B.1023 [15] VOGT H. Efficient object identification with passive RFID tags[C]. The International Conference on Pervasive Computing, Zurich, Switzerland, 2002. doi: 10.1007/3-540-45866-2_9. [16] CHEN W T. An accurate tag estimate method for improving the performance of an RFID anticollision algorithm based on dynamic frame length ALOHA[J]. IEEE Transactions on Automation Science and Engineering, 2009, 6(1): 9–15. doi: 10.1109/TASE.2008.917093 [17] 丁建立, 韩宇超, 王家亮. 基于粗精二次估计的RFID标签数目估算方法[J]. 计算机应用, 2017, 37(9): 2722–2727. doi: 10.11772/j.issn.1001-9081.2017.09.2722DING Jianli, HAN Yuchao, and WANG Jialiang. Estimation method for RFID tags based on rough and fine double estimation[J]. Journal of Computer Applications, 2017, 37(9): 2722–2727. doi: 10.11772/j.issn.1001-9081.2017.09.2722 [18] 钟兆根, 于柯远, 孙雪丽. 基于序贯蒙特卡罗的非同步长码DS-CDMA信号扩频码及信息序列联合估计[J]. 电子与信息学报, 2019, 41(6): 1365–1373. doi: 10.11999/JEIT180157ZHONG Zhaogen, YU Keyuan, and SUN Xueli. Joint estimation of spreading codes and information sequences for asynchronous long code DS-CDMA signals based on sequential monte carlo[J]. Journal of Electronics &Information Technology, 2019, 41(6): 1365–1373. doi: 10.11999/JEIT180157 期刊类型引用(2)
1. 李发陵,彭娟. 基于大数据的复杂超参数优化组合方法仿真. 计算机仿真. 2022(07): 332-336 . 百度学术
2. 刘伟,赵玄玉,查明虎,朱黎,胡涛. 基于霍尔传感器的工业机器人轴电流监测研究. 湖北民族大学学报(自然科学版). 2022(03): 289-293 . 百度学术
其他类型引用(6)
-