喜讯｜荣登榜首！算法赛道高手较量，清博团队实至名归NO.1

寒暄
2021-09-18 11:44:00

近日，清博团队在2021全球开放数据应用创新大赛-算法赛道“基于文本挖掘的企业隐患排查质量分析模型”赛题中拔得头筹，初复赛均登顶榜首！

相约一场关于

未来与智慧的较量

2021全球开放数据应用创新大赛以“未来城市、智慧湾区”为主题，聚焦未来城市场景、关注民生“七有”，立足湾区、面向全球。吸引了来自不同领域行业、年龄的选手参与，大赛共分为创意赛道、算法赛道、畅想赛道，不同赛道专业人才齐聚一堂，进行一场关于未来与智慧的较量！

清博本次参与的为算法赛道——基于文本挖掘的企业隐患排查质量分析模型赛题，在与635个团队同台竞技中，清博团队在初复赛中均取得第一名的好成绩！

难度升级

登顶榜首有多难？

企业在填报隐患时，往往存在不认真填报的情况，“虚报、假报”隐患内容，增大了企业监管的难度。采用大数据手段分析隐患内容，可有效提高监管工作效率，增强企业安全责任意识。

本次赛题的任务即为参赛方提供企业填报的隐患数据，看参赛选手能否通过智能化手段最快最准确识别其中是否存在“虚报、假报”的情况。

对于团队而言，不仅需要建立模型抓取隐患数据，更需要对数据展开多维度分析，精准找出隐患主体，难度系数较高！此外，除了要与众多高手的角逐，大赛方还制订了严格的评审标准，需历经多重选拔，才可脱颖而出！

为什么是榜首？

实战经验炼内功

依托清博AI算法的平台化，以及成熟的深度学习预训练技术，目前我们的算法模型从开源情报领域，已扩展到金融、医疗、房产、电力等行业，并且在这些行业的算法赛事上也都取得了不错的成绩。多行业多项目的实战经验也修炼了技术小伙伴们扎实的内功！

一站式内容分析平台提效率

为了满足不同行业的对内容智能分析的需求，清博开发了一站式内容分析平台，打通了内容数据的接入、算法模型定义、模型训练、内容分析到最终产出有价值数据的全流程，通过平台化以及AutoML技术，让企业可以标注与自身业务相关的数据，把算法模型的开发与训练交给平台去完成。降低了企业使用智能化技术的门槛，提高了对内容智能分析的效率。

算法模型来创新

本次参赛清博技术团队使用了多种预训练模型，其中对NeZha相较于源码做了10%的优化提速；在模型训练过程中采用了对抗训练、对比学习以及阈值搜索等方法，充分发挥模型的性能；模型结构优化，采用蒸馏、ONNX等方式提高了大约20多倍的推理速度，最终模型准确率达到了99.5%；在落地应用价值上，推荐使用模型筛选判断大部分数据集，剩余约万分之八的数据以人工核验的方式处理，极大地节约了企业人力成本。

听不懂？没关系，翻译下：清博这次算法模型不仅准确率高还兼顾了处理效率。

此次获奖是对清博产品的肯定，也是对整个清博团队的肯定与鼓励。人工智能的发展潜力是无穷的，清博智能始终坚持用AI赋能多重应用场景，努力为行业发展贡献一份力量！

加入小组后即可参加投票

确定

回复转发赞收藏查看所有回复

你的回复

回复请先登录 , 或注册

广告人丶公关人

83227 人聚集在这个小组

加入小组

喜讯｜荣登榜首！算法赛道高手较量，清博团队实至名归NO.1

寒暄
2021-09-18 11:44:00

你的回复

相关内容推荐

最新讨论 ( 更多 )

喜讯｜荣登榜首！算法赛道高手较量，清博团队实至名归NO.1

寒暄 2021-09-18 11:44:00

你的回复

相关内容推荐

最新讨论 ( 更多 )

寒暄
2021-09-18 11:44:00