李彦宏：文心一言对标ChatGPT门槛很高，百度在全球大厂中第一个做出来

时间：2024-12-15 14:39:18 作者：officeba下载来源：原创

3月16日下午，百度在北京总部召开发布会，主题为模型和生成新一代AI产品文心一。百度创始人、董事长兼CEO 李彦宏和百度首席技术官王海峰出席，展示了文心一在文学创作、商业文案、数学计算、中文理解、多模态生成五个使用场景下的综合能力。

从现场展示来看，文心一在一定程度上具备了理解人类意图的能力，回答的准确性、逻辑性和流畅性也逐渐接近人类水平。不过，李彦宏也多次提到，这种大语言模型还远未完善，还有很大的提升空间。以后肯定会快速发展，日新月异。

百度同时公布了文心一的邀请测试方案。3月16日起，首批用户可通过邀请测试码在官网文心一体验产品，之后将陆续向更多用户开放。此外，百度智能云即将向企业客户开放API接口调用服务。3月16日正式开启预约，搜索“百度智能云”进入官网，即可申请加入文心一云服务测试。

目前大语言模型和生成 AI代表了一种新的技术范式，这是全球每个企业都不能错过的机会。百度文心一基于人工智能的赋能平台，将助力金融、能源、媒体、政务的智能化转型。李彦宏说:“百度希望和大家一起推动人工智能技术的进步，让每个人都能使用最先进的生产力工具，并从中受益。”

发布会上，李彦宏展示了文心一在文学创作、商业文案创作、数学计算、中文理解、多模态生成五个使用场景下的表现。

在文学创作的场景中，文心一阎根据对话的问题总结了知名科幻小说《三体》的核心内容，提出了续写《三体》的五点建议，体现了对话问答、总结分析、内容创作的综合能力生成。

此外，颜文心一准确回答了《三体》作者、电视剧角色扮演者等事实性问题。生成 AI在回答事实题时往往会“捏造”，而/[K1/]则延续了百度知识增强的理念，大大提高了事实题的准确率。

在商业文案的创意现场，文心一闫顺利完成了公司命名、写广告语、写新闻稿的创意任务。

在连续三次的内容创作中生成，文心一词不仅能准确理解人类意图，还能清晰表达，是基于庞大数据规模的“智能涌现”。文心一颜大模型训练数据包括万亿级网页数据、数十亿搜索数据和图片数据、数百亿日均语音通话数据、5500亿事实知识图谱。

文心一颜也有一定的思维能力，可以学习数学推导、逻辑推理等相对复杂的任务。面对“鸡兔同笼”这个经典问题，文心一能够理解问题的含义并有正确的思维去解决，然后像学生做题一样一步步算出正确答案。

文学创作、商务文案、数学计算是大语文模型共同的优势和能力。在此基础上，文心一也表现出了更好的中文理解和多模态生成能力。

在现场展览中，文心一严正确地解释了“洛阳纸贵”的含义及相应的经济理论，还用“洛阳纸贵”一词创作了一首藏头诗。

多模态生成方面，/[K3/]现场演示了文心一文字生成文字、图片、音频、视频的能力。有意思的是，文心一方言甚至可以生成四川话发音；文心一视频生成能力由于成本较高，现阶段不对所有用户开放，以后会逐步接入。

“多模态是生成 AI明显的发展趋势。”李彦宏的意思是“未来随着百度的多模态统一模型能力的增强，文心一的多模态生成能力会不断提升。"

从文心一的表现来看，一定程度上它具备了理解人类意图的能力，回答的准确性、逻辑性、流畅性也逐渐接近人类水平。但总的来说，这种大语言模型还远远不够完善，还有赖于通过真实的用户反馈逐步迭代。

王海峰说文心一是新一代知识增强语言模型，是在厄尼和柏拉图系列模型的基础上发展起来的。其关键技术包括监督微调、具有人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型会采用的技术，在ERNIE和PLATO中有应用和积累，在文心一中进一步强化和打磨；后三项是百度现有技术优势的再创新，也是文心一未来越来越强大的基础。

李彦宏强调:“文心一会在真实用户反馈、开发者调用和模型迭代之间架起飞轮，效果迅速提升，给你一个‘三天不看’的惊喜。”

李彦宏说目前百度是全球首家对标ChatGPT产品的企业。李彦宏指出:“无论哪个公司，都不可能突击几个月就做出这么大的语言模型。深度学习和自然语言处理需要多年的坚持和积累，不能加速。”

可以说文心一是百度这几年努力的延续。人类已经进入人工智能时代，IT技术的技术栈发生了根本性的变化，从过去的三层变成了“芯片-框架-模型-应用”的四层。如今，百度是全球为数不多的在这四层全栈布局的人工智能公司。从高端芯片昆仑芯，到飞桨的深度学习框架，再到文心大学模型的前期训练，再到搜索、智能云、自动驾驶、小度等应用，各个层面都有领先业界的自研技术。

李彦宏认为百度AI全栈布局的优势在于可以在technology stack的四层架构中实现端到端的优化，大大提高效率。尤其是框架层和模型层之间，有很强的协同作用，可以帮助构建更高效的模型，显著降低成本。事实上，超大规模模型的训练和推理给深度学习框架带来了巨大的挑战。例如，为了支持数千亿参数模型的高效分布式训练，百度 Flyer专门开发了4D混合并行技术。

从2月份“文心一正式公布以来，已经有超过650家企业宣布接入文心一语音生态。

李彦宏预测大语言模型将带来三大产业机会。

第一类是新兴的云计算公司，其主流商业模式已经从IaaS转变为MaaS。文心一将从根本上改变云计算行业的游戏规则。之前企业选择云厂商更看重计算能力、存储等基础云服务。以后会更加关注框架好不好，模型好不好，以及模型、框架、芯片、应用之间的协调。

文心一智能云将对外提供服务，帮助企业搭建自己的模型和应用。农业、工业、金融、教育、医疗、交通、能源等重点领域的效率将大幅提升，在各行业快速形成新的产业空间，助力数字中国的实现。李彦宏宣布百度智能云将于近期召开发布会，主题为文心一云服务及应用产品，包括公有云服务及私有化部署。

第二类是微调行业模型的公司，是GM 模型和企业之间的中间层。他们可以基于对行业的洞察调用GM 模型能力，为行业客户提供解决方案。对此，百度文信达模型发布了电力、金融、传媒模型等领域的10余个主要行业。

第三类是基于大模型基座开发应用的公司，即应用服务提供商。李彦宏断言对于大多数创业者和企业来说，真正的机会不是从零开始做ChatGPT和文心一，这是不现实的，也是不经济的。基于通用语言模型首先开发重要的应用服务可能才是真正的机会。目前，基于文字生成、图像生成、音频生成、视频生成、数字人、3D等场景，涌现出了很多明星公司，这些公司可能是未来的新巨头。

“我们相信人工智能将彻底改变我们今天拥有的每一个行业。AI的长期价值和对各行各业的颠覆性改变才刚刚开始。未来会有更多的杀手级应用和现象级产品，会有更多的里程碑。”李彦宏说。

以上就是小编给大家带来的李彦宏：文心一言对标ChatGPT门槛很高，百度在全球大厂中第一个做出来的全部内容了，如果对您有帮助，可以关注officeba网站了解后续资讯。

[!--classname--]