3月16日下午,百度在北京总部召开发布会,主题为模型和生成新一代AI产品文心一。百度创始人、董事长兼CEO 李彦宏和百度首席技术官王海峰出席,展示了文心一在文学创作、商业文案、数学计算、中文理解、多模态生成五个使用场景下的综合能力。
从现场展示来看,文心一在一定程度上具备了理解人类意图的能力,回答的准确性、逻辑性和流畅性也逐渐接近人类水平。不过,李彦宏也多次提到,这种大语言模型还远未完善,还有很大的提升空间。以后肯定会快速发展,日新月异。
百度同时公布了文心一的邀请测试方案。3月16日起,首批用户可通过邀请测试码在官网文心一体验产品,之后将陆续向更多用户开放。此外,百度智能云即将向企业客户开放API接口调用服务。3月16日正式开启预约,搜索“百度智能云”进入官网,即可申请加入文心一云服务测试。
目前大语言模型和生成 AI代表了一种新的技术范式,这是全球每个企业都不能错过的机会。百度文心一基于人工智能的赋能平台,将助力金融、能源、媒体、政务的智能化转型。李彦宏说:“百度希望和大家一起推动人工智能技术的进步,让每个人都能使用最先进的生产力工具,并从中受益。”
发布会上,李彦宏展示了文心一在文学创作、商业文案创作、数学计算、中文理解、多模态生成五个使用场景下的表现。
在文学创作的场景中,文心一阎根据对话的问题总结了知名科幻小说《三体》的核心内容,提出了续写《三体》的五点建议,体现了对话问答、总结分析、内容创作的综合能力生成。
此外,颜文心一准确回答了《三体》作者、电视剧角色扮演者等事实性问题。生成 AI在回答事实题时往往会“捏造”,而/[K1/]则延续了百度知识增强的理念,大大提高了事实题的准确率。
在商业文案的创意现场,文心一闫顺利完成了公司命名、写广告语、写新闻稿的创意任务。
在连续三次的内容创作中生成,文心一词不仅能准确理解人类意图,还能清晰表达,是基于庞大数据规模的“智能涌现”。文心一颜大模型训练数据包括万亿级网页数据、数十亿搜索数据和图片数据、数百亿日均语音通话数据、5500亿事实知识图谱。
文心一颜也有一定的思维能力,可以学习数学推导、逻辑推理等相对复杂的任务。面对“鸡兔同笼”这个经典问题,文心一能够理解问题的含义并有正确的思维去解决,然后像学生做题一样一步步算出正确答案。
文学创作、商务文案、数学计算是大语文模型共同的优势和能力。在此基础上,文心一也表现出了更好的中文理解和多模态生成能力。
在现场展览中,文心一严正确地解释了“洛阳纸贵”的含义及相应的经济理论,还用“洛阳纸贵”一词创作了一首藏头诗。
多模态生成方面,/[K3/]现场演示了文心一文字生成文字、图片、音频、视频的能力。有意思的是,文心一方言甚至可以生成四川话发音;文心一视频生成能力由于成本较高,现阶段不对所有用户开放,以后会逐步接入。
“多模态是生成 AI明显的发展趋势。”李彦宏的意思是“未来随着百度的多模态统一模型能力的增强,文心一的多模态生成能力会不断提升。"
从文心一的表现来看,一定程度上它具备了理解人类意图的能力,回答的准确性、逻辑性、流畅性也逐渐接近人类水平。但总的来说,这种大语言模型还远远不够完善,还有赖于通过真实的用户反馈逐步迭代。
王海峰说文心一是新一代知识增强语言模型,是在厄尼和柏拉图系列模型的基础上发展起来的。其关键技术包括监督微调、具有人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型会采用的技术,在ERNIE和PLATO中有应用和积累,在文心一中进一步强化和打磨;后三项是百度现有技术优势的再创新,也是文心一未来越来越强大的基础。
李彦宏强调:“文心一会在真实用户反馈、开发者调用和模型迭代之间架起飞轮,效果迅速提升,给你一个‘三天不看’的惊喜。”
李彦宏说目前百度是全球首家对标ChatGPT产品的企业。李彦宏指出:“无论哪个公司,都不可能突击几个月就做出这么大的语言模型。深度学习和自然语言处理需要多年的坚持和积累,不能加速。”
可以说文心一是百度这几年努力的延续。人类已经进入人工智能时代,IT技术的技术栈发生了根本性的变化,从过去的三层变成了“芯片-框架-模型-应用”的四层。如今,百度是全球为数不多的在这四层全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨的深度学习框架,再到文心大学模型的前期训练,再到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。
李彦宏认为百度AI全栈布局的优势在于可以在technology stack的四层架构中实现端到端的优化,大大提高效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,显著降低成本。事实上,超大规模模型的训练和推理给深度学习框架带来了巨大的挑战。例如,为了支持数千亿参数模型的高效分布式训练,百度 Flyer专门开发了4D混合并行技术。
从2月份“文心一正式公布以来,已经有超过650家企业宣布接入文心一语音生态。
李彦宏预测大语言模型将带来三大产业机会。
第一类是新兴的云计算公司,其主流商业模式已经从IaaS转变为MaaS。文心一将从根本上改变云计算行业的游戏规则。之前企业选择云厂商更看重计算能力、存储等基础云服务。以后会更加关注框架好不好,模型好不好,以及模型、框架、芯片、应用之间的协调。
文心一智能云将对外提供服务,帮助企业搭建自己的模型和应用。农业、工业、金融、教育、医疗、交通、能源等重点领域的效率将大幅提升,在各行业快速形成新的产业空间,助力数字中国的实现。李彦宏宣布百度智能云将于近期召开发布会,主题为文心一云服务及应用产品,包括公有云服务及私有化部署。
第二类是微调行业模型的公司,是GM 模型和企业之间的中间层。他们可以基于对行业的洞察调用GM 模型能力,为行业客户提供解决方案。对此,百度文信达模型发布了电力、金融、传媒模型等领域的10余个主要行业。
第三类是基于大模型基座开发应用的公司,即应用服务提供商。李彦宏断言对于大多数创业者和企业来说,真正的机会不是从零开始做ChatGPT和文心一,这是不现实的,也是不经济的。基于通用语言模型首先开发重要的应用服务可能才是真正的机会。目前,基于文字生成、图像生成、音频生成、视频生成、数字人、3D等场景,涌现出了很多明星公司,这些公司可能是未来的新巨头。
“我们相信人工智能将彻底改变我们今天拥有的每一个行业。AI的长期价值和对各行各业的颠覆性改变才刚刚开始。未来会有更多的杀手级应用和现象级产品,会有更多的里程碑。”李彦宏说。
以上就是小编给大家带来的李彦宏:文心一言对标ChatGPT门槛很高,百度在全球大厂中第一个做出来的全部内容了,如果对您有帮助,可以关注officeba网站了解后续资讯。
2024-12-15