鲲鹏DevKit助力轩辕AI科学计算平台DataLab原生开发,性能提升89%
时间:2025-11-26 23:44:14 出处:物联网阅读(143)
什么是鲲鹏科学科学计算平台 ?
科学研究是人们探索新事物、认知新规律 、助力创造新技术的轩辕重要途径 ,随着人类社会的计算不断进步,今天科学研究已经前进到一个更加复杂深奥的平台世界,研究的生开升对象也向着大范围、多领域的发性复杂系统工程进军。例如,鲲鹏科学航天工程、助力全球气候、免费模板轩辕生态环境问题等 ,计算对科研方法和手段也提出了新的平台挑战。
科学计算作为现代科研主要手段,生开升广泛应用于信息检索、发性环境模拟、鲲鹏科学数值计算、数据分析等场景中,同时,机器学习的迅猛发展也推动着科学计算平台进入了百家争鸣的时代 :各类统计软件 、数据分析软件 、仿真软件、制图软件多如牛毛……然而这种传统的 、云计算分散的科研方式,给科研工作带来了巨大挑战:
● 知识碎片化、孤岛化,难以建立起关联关系;
● AI模型搭建对编程技能要求高 ,时间成本巨大且后期训练优化费时费力;
● 人工处理复杂建模操作 ,效率低,高维方程求解难度大 ,精度和性能无法兼顾;
● 大量机器学习训练数据的采集 、清洗和治理工作繁琐而枯燥;深度学习框架缺乏租户功能,难以实现资源的有效隔离和集群算力的有效管理。
工欲善其事,必先利其器 。香港云服务器为了快速 、实时的分析海量科学数据背后的意义、最大限度地满足科研机构和人员之间交流与协作的需要 ,基于现代信息技术的科研平台对于提高科研水平、促进学科交叉和融合、加强高层次创新人才的培养起着至关重要的作用。
轩辕研究院:
联合鲲鹏打造AI科学计算平台DataLab

轩辕研究院
是轩辕网络旗下的全资子公司,是服务器租用围绕人工智能的科研和实训教学的新型研发机构 ,深耕教育行业23年,是国内领先的AI+产教融合服务商 。该机构依托多年的高校的技术成果,以及丰富的产学研合作方式,将国内外先进的技术成果转化为科研应用技术和产品 ,助力科学技术的研究和创新 。源码下载
轩辕AI科学计算平台DataLab是轩辕研究院联合广州“鲲鹏+昇腾”生态创新中心共同打造的辅助科研工作的一体化解决方案 。该方案集鲲鹏算力 、多领域科研样本数据、算法模型研发以及管理工具于一身 ,能有效支撑机器学习 、神经网络 、知识抽取 、关联规律、智能预测、决策推理和高清科研图表输出等任务 。可用于自然科学与社会科学研究 ,以及计算机 、软件 、高防服务器电子 、自动化相关科研团队进行计算机技术原理性的验证场景 ,基于算法 、数据进行科研实验 ,并形成图形化界面呈现实验结果,攻关技术难题项目 ,助力科技成果转化和推广。

【轩辕AI科学计算平台DataLab解决方案架构】
伴随着科研数据持续爆炸性增长,科学家们需要更高的计算效率、数据处理效率以及工程效率,从而更好地支撑跨领域科研 ,这也对IT平台的算力提出了更高挑战。
● 鲲鹏天然的多核多并发、高性能 、高算力以及低功耗等优势,能够很好的满足科研平台海量数据处理、并行计算 、低时延、绿色计算等要求;
● 作为轩辕研究院AI科学计算平台DataLab的算力底座 ,鲲鹏还提供完善的鲲鹏DevKit开发套件以及专业服务 ,能够帮助用户快速完成应用的迁移、开发、编译和调优 ,支撑科研平台的高效创新。
鲲鹏DevKit 1人天/应用
快速迁移AI科学计算平台
在项目实施初期 ,开发人员需要将DataLab平台快速迁移到鲲鹏。由于整个系统的模块众多给迁移工作带来不少挑战:
● 代码量大:5个子模块\15个微服务,共计100万行左右代码;
● 第三方软件多:包含redis 、rabbitmq、nacos 、datax 、hadoop,500+JAR包,手工查找兼容版本非常耗时;
经分析 ,采用手动迁移的话整个系统15个微服务需要30人天才能完成。
而鲲鹏DevKit代码迁移工具可以实现依赖文件自动识别 、兼容JAR包一键下载、代码修改建议一键替换,无须耗时耗力检查跟进 。在鲲鹏DevKit的帮助下整个系统只用了10人天 ,平均每个服务不到1人天即可完成自动迁移 。

【使用鲲鹏DevKit代码迁移工具进行代码分析】
基于鲲鹏DevKit高效开发建筑违章检测算法模型,性能提升89%
迁移完成之后 ,轩辕研究院需要针对DataLab平台中GIS领域科研场景 ,在鲲鹏平台上新开发建筑违章检测算法模型。在开发过程中 ,为进一步提升业务性能和稳定性,将平台之前使用的OpenJDK换成毕昇JDK ,毕昇JDK在鲲鹏架构中提供了更好的版本稳定性 、GC(Gabarage Collector)性能 、加解密性能 ,能够提升DataLab平台数据处理应用的运行效率。
此外,针对系统出现的性能瓶颈,轩辕研究院的技术人员使用了鲲鹏性能分析工具进行了调优,对操作系统 、JVM的运行状态进行了分析和优化 ,提升DataLab平台AI计算模型相关业务的运行效率 :
在系统性能分析中创建系统全景分析任务
通过采集系统软硬件配置信息,以及系统CPU、内存 、存储IO 、网络IO资源的运行情况,识别出CPU单次利用率高和两处热点函数占比较大的瓶颈,并给出了优化建议