【摘 要】
:
网络I/O在Redis存储过程中是限制存储性能的关键因素,而默认参数或人工参数配置会制约存储性能。针对参数配置不当导致存储吞吐性能下降及时延较高的问题,提出一种存储I/O优化方法GTS。考虑各阶段参数对存储性能的影响,在DPDK的优化原理基础上通过分析处理特性,采用分层模型策略实现对存储性能预测,从而寻找出最优参数调优方案。实验结果表明,与默认参数相比,GTS方法能够有效提升存储吞吐量,且在写密集下较ATH算法具有更低的时延。
【机 构】
:
南京邮电大学计算机学院,江苏省高性能计算与智能处理工程研究中心
【基金项目】
:
国家重点研发计划(2018YFB1003201),国家自然科学基金(61672296,61602261,61872196,61872194,61902196),江苏省科技支撑计划项目(BE2017166,BE2019740),江苏省高等学校自然科学研究重大专项(18KJA520008),江苏省“六大人才高峰”高层次人才项目(RJFW-111)。
论文部分内容阅读
网络I/O在Redis存储过程中是限制存储性能的关键因素,而默认参数或人工参数配置会制约存储性能。针对参数配置不当导致存储吞吐性能下降及时延较高的问题,提出一种存储I/O优化方法GTS。考虑各阶段参数对存储性能的影响,在DPDK的优化原理基础上通过分析处理特性,采用分层模型策略实现对存储性能预测,从而寻找出最优参数调优方案。实验结果表明,与默认参数相比,GTS方法能够有效提升存储吞吐量,且在写密集下较ATH算法具有更低的时延。
其他文献
文中简要分析了大体积混凝土的材料及配置要求,并详细阐述了大体积混凝土的浇筑程序,最后针对大体积混凝土的温度裂缝控制提出了几点措施,以供参考.
为实现互联网全面加密环境下的恶意加密流量精确检测,针对传统识别方法较依赖专家经验且对加密流量特征的区分能力不强等问题,提出一种基于层次时空特征与多头注意力(HST-MHSA)模型的端到端恶意加密流量识别方法。基于流量层次结构,结合长短时记忆网络和Text CNN有效整合加密流量的多尺度局部特征和双层全局特征,并引入多头注意力机制进一步增强关键特征的区分度。在公开数据集CICAnd Mal2017上的实验结果表明,HST-MHSA模型的流量识别F1值相较基准模型最高提升了16.77个百分点,漏报率比HAST
循环神经网络和Transformer在多轮对话系统的建模上依赖大量的样本数据且回复准确率过低。为此,提出一种针对任务型对话系统的建模方法。引入预训练模型对句子语意和对话过程进行深度编码,对Transformer模型进行精简,仅保留编码器部分的单向Transformer,将应答部分抽象成不同的指令,采用孪生网络对指令进行相似度排序,选择相似度最高的指令生成应答。在MultiWOZ数据集上的实验结果表明,与LSTM和基于Transformer模型相比,该方法预测速度更快,在小数据集上具有更好的性能,在大数据集
针对实用拜占庭容错算法PBFT共识时延高、视图切换效率低、动态性不足等问题,提出一种基于备选投票机制的低时延共识算法IPBFT。通过增设候补集合,使系统的共识节点能够支持动态增加和减少,同时优化视图切换协议,使算法能够在只有两个阶段的情况下完成共识过程,降低系统的通信开销。在此基础上,将算法的主节点选取方式改进为投票选举机制,在节点进行共识的过程中实现主节点的选举,从而减少视图切换所需的通信次数和时延。实验结果表明,IPBFT算法较原始PBET算法具有更低的共识时延和更高的吞吐量,并且能够较好地支持节点动
针对5G/B5G网络的热点场景中存在数据流量激增及基站与用户设备(UE)之间空间耦合的问题,构造一种基于泊松簇过程的无人机(UAV)协助的多层毫米波异构蜂窝网络模型。为提高该多层网络模型的平均区域吞吐量(AAT),提出基于最大偏置接收功率(BRP)准则的4层级联方案。借助毫米波传输模型和随机几何数学工具,通过UE级联概率及各层基站对UE干扰的拉普拉斯变换,推导出系统条件覆盖概率和AAT的数学解析表达式。研究UAV基站投影在地面上的分布方差、地面基站的密度对级联概率的影响,比较不同级联方案可获取的系统AAT
为消除卷积神经网络前向计算过程中因模型参数的稀疏性而出现的无效运算,基于现场可编程门阵列(FPGA)设计针对稀疏化神经网络模型的数据流及并行加速器。通过专用逻辑模块在输入通道方向上筛选出特征图矩阵和卷积滤波器矩阵中的非零点,将有效数据传递给由数字信号处理器组成的阵列做乘累加操作。在此基础上,对所有相关的中间结果经加法树获得最终输出特征图点,同时在特征图宽度、高度和输出通道方向上做粗颗粒度并行并寻找最佳的设计参数。在Xilinx器件上进行实验验证,结果表明,该设计实现VGG16卷积层综合性能达到678.2
在单传感器数码相机图像采集系统的彩色滤波阵列中,每个像素仅捕获单一颜色分量,并且在彩色图像重构过程中图像边缘等高频区域的伪影现象尤为明显。提出一种基于生成对抗网络的图像去马赛克算法,通过设计生成对抗网络的生成器、鉴别器和网络损失函数增强学习图像高频信息的能力,其中使用的生成器为具有残差稠密块和远程跳跃连接的深层残差稠密网络,鉴别器由一系列堆叠的卷积单元构成,并且结合对抗性损失、像素损失以及特征感知
针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效。在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不同大小的输入数据,同时调整加速器的数据通路,对耗时操作进行单独或结合运算,以适应不同的轻量化网络。FPGA平台验证结果表明,该处理器在100 MHz工作频率下推理Squeeze Net网络,
针对配电站无人值守作业机器人执行巡检任务时对指针式仪表的识读需求,提出一种结合MSER-Otsu阈值分割与Hough变换直线矫正的仪表指针定位算法。利用最大稳定极值区域算法从表盘图像中粗提取出指针区域,引入迭代Otsu算法进一步对该区域进行阈值分割,将指针、阴影和背景区域像素点分离后仅保留指针的二值化图像,对其采用Hough变换进行指针中心线预定位,再以Huber loss为最优化函数对预定位直线
针对5G/B5G网络热点通信场景中基站(BS)部署的异构性以及用户设备(UE)与BS之间的耦合问题,提出一种面向密集热点区域的三层异构网络建模方案。将宏BS(MBS)和微微BS(PBS)的位置建模为泊松点过程,将分散在热点中心的UE和低功耗毫微微BS(FBS)建模为泊松簇过程,将PBS覆盖范围之外的UE和FBS建模为两个独立的泊松洞过程。在此基础上,设计UE分类和级联准则,推导簇中心和簇边缘UE的级联概率与级联距离的统计表达式,并考虑有序FBS和非有序FBS的两种级联情况。实验结果表明,当目标UE与FBS