如何让AI像大脑一样?百度发布ERNIE2.0可持续学习成亮点
央广网北京8月1日消息(记者 梁爽)人机对话、问答系统、语言翻译......随着人工智能深度学习的发展,AI在各应用场景深耕有了更多可能。如果说人工智能的核心是认知,那么认知的核心技术之一就是“语义理解”。
人脑约有1000亿个神经元,神经元之间约有上万亿的突触连接,形成了迷宫般的网络连接。人们每天识字、阅读,看似简单的操作实际是由一个复杂的大脑系统来支撑,如何像大脑一样处理语言信息?这也成为人工智能深度学习的内在逻辑。
ERNIE 2.0可持续学习成亮点
“比如提到哈尔滨,人们会自然联想到黑龙江、省会、冰雪、等很多信息,但是对于机器来说,就需要算法去弥补。”百度自然语言处理部副总监忻舟在昨天(31日)百度开放日上说到,百度的ERNIE 通过学习词与实体的表达,使模型能够建模出哈尔滨与黑龙江的关系,可学到哈尔滨是黑龙江的省会以及哈尔滨是个冰雪城市,从而增强了机器对于人类语言的理解。
开放日当天,百度宣布ERNIE升级到了2.0版本。记者了解到,该框架支持增量引入词汇(lexical)、语法 (syntactic) 、语义 (semantic) 等3个层次的自定义预训练任务,能够捕捉训练语料中的词法、语法、语义等潜在信息。这些任务通过多任务学习对模型进行训练更新,每当引入新任务时,该框架可在学习该任务的同时,不遗忘之前学到过的信息。这也意味着,该框架可以通过持续构建训练包含词法、句法、语义等预训练任务,持续提升模型效果。
忻舟表示,目前,百度ERNIE 2.0的Fine-tuning代码和英文预训练模型已开源。
NLP技术加持AI落地各场景
什么是自然语言处理技术(NLP)?简单理解,NLP就是让机器能够理解人类的语言,是人和机器进行交流的技术。作为人工智能理解信息的核心手段,近年来NLP突破频频,并开始往更多垂直场景落地应用。
央视网技术事业群副总经理朱立松在活动现场分享到:“当前传统视频生产运营面临着智能化生产、信息风险管控、内容创新等挑战,中央广播电视总台就人工智能赋能新媒体做出了大量的探索与尝试,而NLP技术是自动文摘、文本挖掘(文本分类)、信息检索等AI应用的基础。”
借助百度大脑NLP的情感倾向分析功能与评论观点抽取功能,国美上线的“服务评分智能化解决方案”可自动分析用户评论并自动处理。“现在国美客服运营人力需求从一天5人降低到3人,负面问题处理率从60%飙升至100%,售后师傅的差评率也整体降低了7%。” 国美零售控股国美管家技术总监高旭说。
纵横文学产品总监张皓也肯定了百度大脑NLP对内容产业的价值。在接入了文本审核能力之后,机器初审替代人工评级,审核速度由每人每天60万字提升到600万字,并且对于风险内容和问题章节能够及时处理,只要两人就能完成。