喜讯|荣登榜首!算法赛道高手较量,清博团队实至名归NO.1
寒暄
近日,清博团队在2021全球开放数据应用创新大赛-算法赛道“基于文本挖掘的企业隐患排查质量分析模型”赛题中拔得头筹,初复赛均登顶榜首!

相约一场关于
未来与智慧的较量
01
2021全球开放数据应用创新大赛以“未来城市、智慧湾区”为主题,聚焦未来城市场景、关注民生“七有”,立足湾区、面向全球。吸引了来自不同领域行业、年龄的选手参与,大赛共分为创意赛道、算法赛道、畅想赛道,不同赛道专业人才齐聚一堂,进行一场关于未来与智慧的较量!
清博本次参与的为算法赛道——基于文本挖掘的企业隐患排查质量分析模型赛题,在与635个团队同台竞技中,清博团队在初复赛中均取得第一名的好成绩!


难度升级
登顶榜首有多难?
02
企业在填报隐患时,往往存在不认真填报的情况,“虚报、假报”隐患内容,增大了企业监管的难度。采用大数据手段分析隐患内容,可有效提高监管工作效率,增强企业安全责任意识。
本次赛题的任务即为参赛方提供企业填报的隐患数据,看参赛选手能否通过智能化手段最快最准确识别其中是否存在“虚报、假报”的情况。
对于团队而言,不仅需要建立模型抓取隐患数据,更需要对数据展开多维度分析,精准找出隐患主体,难度系数较高!此外,除了要与众多高手的角逐,大赛方还制订了严格的评审标准,需历经多重选拔,才可脱颖而出!

为什么是榜首?
03
实战经验炼内功
依托清博AI算法的平台化,以及成熟的深度学习预训练技术,目前我们的算法模型从开源情报领域,已扩展到金融、医疗、房产、电力等行业,并且在这些行业的算法赛事上也都取得了不错的成绩。多行业多项目的实战经验也修炼了技术小伙伴们扎实的内功!
一站式内容分析平台提效率
为了满足不同行业的对内容智能分析的需求,清博开发了一站式内容分析平台,打通了内容数据的接入、算法模型定义、模型训练、内容分析到最终产出有价值数据的全流程,通过平台化以及AutoML技术,让企业可以标注与自身业务相关的数据,把算法模型的开发与训练交给平台去完成。降低了企业使用智能化技术的门槛,提高了对内容智能分析的效率。
算法模型来创新
本次参赛清博技术团队使用了多种预训练模型,其中对NeZha相较于源码做了10%的优化提速;在模型训练过程中采用了对抗训练、对比学习以及阈值搜索等方法,充分发挥模型的性能;模型结构优化,采用蒸馏、ONNX等方式提高了大约20多倍的推理速度,最终模型准确率达到了99.5%;在落地应用价值上,推荐使用模型筛选判断大部分数据集,剩余约万分之八的数据以人工核验的方式处理,极大地节约了企业人力成本。
听不懂?没关系,翻译下:清博这次算法模型不仅准确率高还兼顾了处理效率。
此次获奖是对清博产品的肯定,也是对整个清博团队的肯定与鼓励。人工智能的发展潜力是无穷的,清博智能始终坚持用AI赋能多重应用场景,努力为行业发展贡献一份力量!
你的回复
回复请先 登录 , 或 注册相关内容推荐
最新讨论 ( 更多 )
- 新建了一个媒介交流群 (豆友eCm3IC1R3c)
- ✅✅✅【上海自由设计师接单】承接:logo设计,海报设计... (上海自由设计师)
- Marketing工作,是白女最好的嫁妆? (文一刀ivy)
- B站 视频号 500粉 千粉万粉报价低的🉑️豆 直发价格 (-星.)
- 需要抖音、小红书账号 (撒哈拉)