2014, 36(5): 1126-1132.
doi: 10.3724/SP.J.1146.2013.00400
刊出日期:2014-05-19
该文针对图像融合领域内难于对先验知识加以利用的问题提出一种新的有监督学习的Takagi Sugeno Kang (TSK)模糊系统图像融合方法。该方法通过引入TSK模糊系统构建标准图像融合图像库进行学习,将学习准则记录下来形成融合模型,并指导新的图像融合过程。不同于传统方法,该方法可以有效地避免模型参数择优的难题,在融合图像质量和适用范围方面表现出一定的优势。从单一类型图像融合和多种类型图像融合两个角度进行了实验研究,实验结果说明该方法的有效性。
2022, 44(8): 2949-2956.
doi: 10.11999/JEIT210537
刊出日期:2022-08-17
针对目前图像隐写检测模型中线性卷积层对高阶特征表达能力有限,以及各通道特征图没有区分的问题,该文构建了一个基于多层感知卷积和通道加权的卷积神经网络(CNN)隐写检测模型。该模型使用多层感知卷积(Mlpconv)代替传统的线性卷积,增强隐写检测模型对高阶特征的表达能力;同时引入通道加权模块,实现根据全局信息对每个卷积通道赋予不同的权重,增强有用特征并抑制无用特征,增强模型提取检测特征的质量。实验结果表明,该检测模型针对不同典型隐写算法及不同嵌入率,相比Xu-Net, Yedroudj-Net, Zhang-Net均有更高的检测准确率,与最优的Zhu-Net相比,准确率提高1.95%~6.15%。
2007, 29(11): 2669-2671.
doi: 10.3724/SP.J.1146.2006.00604
刊出日期:2007-11-19
关键词:
语音编码;基音量化;波形内插
基音在语音编码中通常采用7bit无失真均匀量化。由于浊音段语音的基音普遍具有缓慢渐变的特点,为了更有效地去除前后帧基音之间存在的相关性,该文基于Eriksson和Kang提出的4bit基音量化算法,针对汉语语音进行研究,实现了一套4~6bit基音量化算法。该算法计算简单,无需码书存储。将此基音量化方案应用于WI模型和WI编码器,主观A/B听力测试结果表明,该方案在高效量化基音的同时保证了合成语音质量几乎没有损失,完全满足低速率WI编码器对量化基音的要求。
2015, 37(9): 2082-2088.
doi: 10.11999/JEIT150074
刊出日期:2015-09-19
经典数据驱动型TSK(Takagi-Sugeno-Kang)模糊系统在获取模糊规则时,会考虑数据的所有特征空间,其带来一个重要缺陷:如果数据的特征空间维数过高,则系统获取的模糊规则繁杂,使系统复杂度增加而导致解释性下降。该文针对此缺陷,探讨了一种基于模糊子空间聚类的〇阶L2型TSK模糊系统(Fuzzy Subspace Clustering based zero-order L2- norm TSK Fuzzy System, FSC-0-L2-TSK-FS)构建新方法。新方法构建的模糊系统不仅能缩减模糊规则前件的特征空间,而且获取的模糊规则可对应于不同的特征子空间,从而具有更接近人类思维的推理机制。模拟和真实数据集上的建模结果表明,新方法增强了面对高维数据所建模型的解释性,同时所建模型得到了较之于一些经典方法更好或可比较的泛化性能。