首页 > 海昌柯基 > 正文

百度吴甜:今年是AI大模型落地关键年

发布时间:2022-05-27来源:未知 编辑:生活头条

客服

5月27 日消息,近日,百度飞桨文心全景图升级,在模型层,一次性发布10个大模型。此举让本就炙手可热的“AI大模型”话题再成为行业焦点。

此次文心发布的10个大模型包括2个行业大模型:文心联合国家电网研发的知识增强的能源行业NLP大模型“国网-百度·文心”、联合浦发银行研发的知识增强的金融行业NLP大模型“浦发-百度·文心”;以及文心基础大模型和任务大模型共8个,包括:融合任务相关知识的千亿大模型ERNIE 3.0 Zeus,多任务视觉表征学习VIMER-UFO 2.0、商品图文搜索表征学习VIMER-UMS、文档图像表征学习VIMER-StrucTexT 2.0,语音-语言跨模态大模型ERNIE-SAT、地理-语言跨模态大模型ERNIE-GeoL,以及面向生物计算领域的化合物表征学习HELIX-GEM和蛋白质结构分析HELIX-Fold。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,AI大模型历经了前几年的探索期、突破期,现在已经一定程度上到达推广期,今年是大模型落地关键年。

AI大模型落地关键

吴甜认为,从应用落地角度来看,对于大模型落地而言,最关键要解决的问题是“前沿技术”与“真实应用场景”之间的鸿沟。怎么匹配上应用落地时候全方位的要求?这是AI大模型今年需要核心解决的问题。

“从百度多年来推进大模型技术角度来说,我们认为需要做好这三个方面的工作“,吴甜表示,”一是大模型本身需要是体系性的,而且这个大模型体系能够和应用的场景衔接上;二是平台、工具能够适配到落地应用所需要的工作和方法论。能够全流程、端到端的支持整个落地应用,把大模型的能力能够在场景当中发挥出来;三是需要有一个生态依托,包括应用生态、硬件生态的建设等等。综合来说,在‘搭建更适配场景需求的大模型体系,提供全流程支持应用落地的工具和方法,建设激发创新的开放生态’这三个方面需要拓展和开展工作。”

不是一个大模型通吃

百度的思路不是一个AI大模型通吃所有问题。飞桨文心大模型包含三类模型:基础大模型、任务大模型、行业大模型。

其中,以ERNIE为代表的基础大模型。基础大模型具有学习数据量大、参数规模大特点,通用性最高。但直接使用基础模型往往会与场景上苛刻的应用需求会有一定差距。

因此,在通用的基础大模型上,飞桨文心大模型增加了两类模型:任务大模型和行业大模型。

任务大模型主要面向特定任务,如NLP领域的信息抽取、对话、搜索等,以及视觉领域的商品图文搜索,多任务统一表征等;

再结合行业,推出行业大模型,由通用文心大模型作为基础,在海量广泛数据中挖掘行业领域数据,并与行业中的头部企业或机构合作引入行业特色数据与知识,让通用大模型充分学习,进一步提升大模型的行业应用能力,为行业头部企业建设对行业场景更适配的AI基础设施,共同推进大模型的深度应用。

吴甜称:“这三层模型的组合,使得文心大模型既有很强的基础大模型、又有面向任务问题的专有大模型、还有更适配行业场景的行业大模型,具有能够结合场景落地的全面模型能力。”

与此同时,为了能够把大模型的价值在应用场景中能够充分发挥,能够更低门槛支持广大使用者使用,文心大模型配套建设了工具和平台,包含对抗学习、小样本学习等多种精调方法、高性能部署方案,全面地提供大模型使用中需要的多种数据预处理工具,降低数据处理工作的门槛。

吴甜介绍,一方面文心在百度内部的各种产品中,已经得到广泛应用。比如搜索场景已经全面使用以文心ERNIE为基础的模型,为文心收获了大量反馈;另一方面,通过生态、百度智能云的业务,文心跟大量行业客户、合作伙伴持续合作,持续得到反馈,并进行优化。未来,文心大模型将持续降低应用门槛,推动产业智能化升级,让人工智能技术惠及每一个人。

大家都在评