大模型落地的故事，离「千行百业」又近了一点-观察爆料社- 每天分享精彩瞬间，乐享精彩时光

当前位置：首页 >趣汇 >大模型落地的故事，离「千行百业」又近了一点

大模型落地的故事，离「千行百业」又近了一点

发布时间：2025-09-09 06:39:35 来源：观察爆料社- 每天分享精彩瞬间，乐享精彩时光作者：风闻汇

大模型落地的大模地故事，离「千行百业」又近了一点

当科技的脚步踏入机器智能时代，一项工艺创新带来的故事变革能够深入千行百业，离不开其底层的离千通用性、能实现自动化生产的业又能力。过去半年中，近点上海中专课后操场激情由 ChatGPT、大模地GPT-4 等为代表掀起的型落行百浪潮中，大模型在解决多项任务中的故事通用能力，让人们看到了智能时代 AI 大规模落地的离千可行性。

据不完全统计，业又当前国内已发布超过 80个大模型产物，近点对应不同行业、大模地不同应用场景，型落行百各个大厂和研究机构纷纷加入资源竞赛的故事大模型游戏，“百模大战”正如火如荼地进行。

而现实的情况是，训练成本高的基础大模型在满足细分场景下的特定需求上正显示出“牛刀小用”的短板，同时，在专业领域问题的表现上、甚至会出现模型“一本正经地胡说八道”的幻觉。有业内人士就指出，ChatGPT 给出的结果正确与否、需要交由专业的人去判断。

业界对大模型的应用需求井喷，但面对基础大模型在生产环节的准确率相对较低、能力表现不匹配等情况，为 AI 的“iPhone 时刻”而沸腾的从业者们也不得不被迫“降温”。

在大模型落地的讨论中，几个关键的问题亟需获得解答：AI 的通用性是否被高估？什么样的大模型，才能称得上智能生产力？行业需要怎样的大模型和支持？

下一轮竞赛的决胜手

2002 年诺贝尔经济学奖得主 Daniel Kahneman 在其书《Thinking Fast And Slow》中，提出人类的两种思考模式，第一种是以直觉判断为主的“快思考”，第二种是“慢思考”，需要进行大量的推理和计算。

大模型与以往机器智能工艺的不同之处，就在于它采用了第二种“慢思考”的模式，在与人类的交互中不断学习，进而获得更好解决问题的能力。

由此，日本异国恋人整套流出过去四个多月里，国内也出现了一批追赶 ChatGPT 热潮的对话交互类大模型，以满足 C 端客户娱乐、创作等基础需求，应用在如聊天、语句优化、文案创作等通识属性较强的场景上。

当我们将大模型能力迁移到需求更大的产业领域中，不可避免地会遇到更低频、长尾的复杂场景和大规模协同的需求。这些场景由于样本少、信息分布不均，也意味着在相应的研发上要支付更高昂的成本，通用大模型的优势由此显现。

然而事实上，尽管大模型落地的呼声高涨，但在解决专业知识领域的问题表现上仍有不足之处，关于 AI 通用能力是否被高估的讨论重回焦点。

一位从事信息结构化模型研发负责人告诉AI 科技评论，具备知识图谱、能对行业知识和信息进行提炼的小模型，在专业领域中的能力一定会超过大模型。

以银行场景中的基金对账单托管业务为例，通用大模型可以对结构化信息进行提取和一定的推理，但由于市场中基金公司众多，往往每家公司的账单样式都不相同，加之复杂的表格和图文呈现方式，因此，模型的通用能力在解决特定信息、非结构化信息的抽取需求上，效果也会大打折扣。

再比如煤矿开采流程，煤矿井下重视生产保障，不便于异常样本的人工制造，只能在过往案例中去学习，因此也就存在不够精准的问题。专业人士指出，“大模型在专业知识领域大概只能做到百分之六七十的准确率，外行人看着可能觉得效果不错，但在内行人看来是无法使用的。”

在行业生产环节中，95% 是一个标准，企业对模型容忍度低、精度和效率要求更高，通用大模型的局限性问题愈加显现。

这决定了行业 Know-How 在生成内容中所起到的关键性作用。

人类从生活和工作中积累经验、凝结出智慧，将行业领域知识注入模型当中，提升模型对知识的记忆和推理能力，可以有效填补基础模型和场景之间的认知鸿沟。

“知识增强型”行业大模型已成为产业共识，是更接近人类大脑、释放智能生产力的 AI 落地范式。

中国工程院院士邬贺铨也表示，Chat类的大模型引发新一轮热潮，但对话、写诗、作画绝不是大模型的全部。“我们需要去深入思考大模型的应用方向，要将大模型切实投入到城市增长、金融科技、生物医药、工业制造、科学研究等领域，也需要专业的企业和组织加速其在实体产业落地，为产业刚需带来实实在在的大价值，去真正意义大规模支持社会。”

一个形象的比喻是，通用大模型更像大学，但它不会统治一切，行业大模型是不同科目培养出来的千千万万个大学生，它们所做的事情是怎么“学以致用”，与实体产业深度融合。

也即是说，行业大模型是构建在基础大模型的能力之上，具备一定的通用能力、能覆盖多任务使用场景，还结合了行业 Know- How 或引入知识图谱、有解决专业领域问题能力。

正如上述银行场景，一个理想的设想是，不具备模型构建能力的企业既能以调用通用大模型对话、生成等全部能力，也可以结合自身需求和特定场景，将有 OCR 专业知识和信息的产物应用在解决智能文档识别与处理的各类垂直难题上。

目前，业内一个普遍的看法是，未来业内只会有两三家大模型独大，与产业更近的行业大模型才是主流方向。行业人士预测，接下来几个月内，行业大模型也将迎来一波密集的发布热潮。

据陆奇在 6 月奇绩创坛春季创业路演上分享的项目信息显示，创业营最终录取的 60 个项目中，大模型项目共 39 个，占比高达 65%，绝大部分都是围绕行业大模型应用展开。

可以看到，行业大模型的故事才刚刚开始，但各路玩家们已经对其寄予了不小的期待。

向行业更深处

据 2022 年工信部发布的《国家机器智能创新应用先导区“智赋百景”》通知显示，在公共保障、交通运输等九大 AI 落地领域中，制造、农业、能源、金融、医疗作为我国关键经济支柱，虽然贡献多、但尚属于 AI 落地未开发领域，场景渗透率较低。

例如在铁路领域中，当前，我国铁路营业里程 15.5 万公里，铁路货车超过 100 万辆，为了保障货车运行的保障性，货车运行故障动态图像检测系统（TFDS、Trouble of moving Freight car Detection System）被广泛应用。但受制于工艺增长，TFDS 仍采用人工方式进行故障识别。

假设货运列车通常编组为 60-100 辆一组，每套 TFDS 对应 5 个拍摄点位，每辆车/每节车厢拍摄约 80 张图片。以平均每列车 50 辆车厢计算，每列车拍摄图片就多达 4000 张，并且需要检测人员在 10 分钟左右时间看完，不仅人力成本高，人力劳动强度也很大，这种重复性、高强度的判断工作极其导致疲劳监测情况的发生，进而导致误判。

大模型的产业化尚任重道远，但行业对落地的诉求已十分迫切。

大模型落地的故事，离「千行百业」又近了一点

华为云机器智能领域首席科学家田奇在4月高峰论坛上作《AI for Industries，赋能千行百业智能升级》演讲

中国工程院院士李伯虎近日也明确指出，制造业是国民经济的主体，特别期望AI大模型能加强制造业“工艺、产业、应用”的进一步融合，研发面向制造业的AI大模型工艺，为我国制造业的数字化转型与智能化升级，进而为实现我国迈入制造强国的伟大战略目标做出新的重大贡献。

在这一背景下，自带场景、信息和客户的行业、产业客户成为了大模型公司相互争夺的资源，而对深入实体产业当中的企业来说，选择与具有自研能力的厂商合作，也省去了他们大量研发模型的资源和时间成本。

目前，面向大模型的行业和产业客户，市场上所提供的合作方案主要有以下几类：一是提供算力支持；二是提供通用大模型的底层设施，企业可以在平台上使用自己的垂类信息训练行业大模型；三是定制化支持的行业大模型；此外还有其他的配套支持，如云端服务、AI 框架等。

总体来说，就是从最底层的算力存储和网络、到上层的机器学习平台、再到配套模型与支持，将每一个需求和反馈都顺畅地传递到大模型工艺及应用的每个环节，提供一套完整的解决方案。

而站在企业的视角上，能够深入行业、进入生产环节的大模型还需要考虑两个问题。首先是私有信息的保障问题，行业大模型想要效果表现好，离不开企业提供足量、质量够高的信息来支撑模型训练要求，这也是为什么多数企业通常选择私有化部署的原因；第二则是成本可控，企业购买大模型支持远不止模型前期的训练和微调成本，还包括了框架、算力等整套支持以及后期运维等。

如今，市面上大模型产物众多，企业也亟需从大模型的商业化狂潮中回归冷静，用性价比最优的方式选择最佳的合作对象。

华为云盘古大模型将至

能否带来新惊喜？

7 月 7 日，华为开发者大会2023（Cloud）将在东莞拉开帷幕。据此前公布的主题演讲议程来看，华为云盘古大模型将迎来重大升级，明确定位“为行业而生”；其中，华为常务董事、华为云 CEO 张平安就“一切皆支持，AI重塑千行百业”进行主题演讲，华为云机器智能领域首席科学家田奇、华为诺亚方舟实验室主任姚骏也将首次揭秘盘古基础大模型的全栈创新、以及行业大模型的“炼成术”。

自四五月份以来，各大厂商和创业公司的大模型层出不穷，相较之下，华为却显得颇为低调，对外几乎没有透露任何关于盘古大模型升级的消息。在 4 月机器智能大模型工艺高峰论坛（下称“高峰论坛”）上，田奇现身会场，对备受瞩目的类 GPT 模型未提及过多细节，更多聚焦在大模型的应用范例介绍，这也令外界颇感不及预期。

华为入场越晚，客户审视的目光也会越挑剔。但当我们开始探究华为“姗姗来迟”背后的原因时却发现，华为在大模型的探索并非刚刚开始，相反，早于 ChatGPT 和大模型火起来之前，华为已经组建起以田奇为核心的大模型人才团队。

2020 年 9 月，盘古大模型立项，彼时确定了三个核心设计原则：一是模型要大、能吸收海量信息，二是网络结构要强、从而真正发挥出模型的性能，三是要具备优秀的泛化能力、能落地到各行各业的工作场景中。

到了 2021 年 4 月，在华为云盘古视觉（CV）大模型对外公布的同一时间，结合行业信息打造系列 CV 行业大模型已经实现了在医疗影像检测、工业缺陷检测和遥感影像分析等多场景中应用，通过模型蒸馏、抽取实现行业场景的适配。

可以说，华为是国内最早加入大模型竞赛、并已经将行业大模型落地的厂商之一。

据田奇在高峰论坛的演讲中提到，华为云将盘古大模型分为了三级：

L0，基础模型，例如GPT-3、GPT-4等这类无法直接应用，需要同相应的行业和场景信息结合训练的行业大模型
L1，行业模型，这类模型可直接在具体细分场景中进行部署
L2，细分场景模型

田奇表示，如何从行业大模型 L1 中快速生产高质量的部署模型（细分场景模型）L2 并部署到端、边、云侧就成了一个关键课题。

MaaS（模型即支持）时代，传统产业和企业在大模型的冲击下正迎来变革性的升级再造，“云智一体”成为共识，集齐资金、人才、信息等优势，向上对接研发和运算规则工程师、个人开发者等，向下为底层软硬件厂商提供支持。

对华为云来说，这也意味着，基于 AI 与云的深度融合，云支持为盘古大模型提供计算资源，企业客户也有了更多 AI 大模型和集成支持的选择，甚至是自上而下全套的 AI 解决方案。

此外，大模型要走向工业大生产，AI 芯片、框架、机器学习平台以及信息、应用等等，都缺一不可。

2022 年 8 月，美国政府签署《2022年芯片和科学法案》，在半导体领域对中国发起的限制日渐升级；而伴随着大模型推升了对算力的狂热需求，公开信息显示，近 5 个月以来，英伟达芯片价格累计涨幅已高达 37.5%， GPU 交货周期也被拉长，需要3个月甚至更长时间。对此，华为在近日也宣布，将于7月份发布面向 AI 大模型的新款存储产物。

经过多年的增长，华为已积累了大模型走向行业落地的全栈工艺，包括 AI 芯片、AI 框架Mindspore、以及全流程支持 MLOps 的 AI 平台 ModelArts 等，一应具全。

同时，华为也积累了丰富的大模型行业实践。例如，在复杂、危险性较高的煤矿生产工作中，华为云去年推出了盘古矿山大模型，只需导入海量无标注的矿山场景信息，即可进行无监督自主学习，仅一个大模型就能覆盖煤矿的采、掘、机、运、通等业务流程下的 1000 多个细分场景。

煤矿行业中存在着场景需求多、矿山间复制难、场景落地难、AI人才不足等挑战，目前 300 米井下仍需大量人员现场作业，面对这一紧迫的需求，如何用 AI 实现“少人无人”的保障高效作业成为煤矿智能化追求的关键目标。

例如，主运系统是煤矿生产的生命线，一旦发生故障，将直接导致停工停产，每天减产几万吨。过去，主运系统十分依赖人工巡检，矿工需要每天走 10 到 20 公里巡检，皮带距离长，周围环境也很恶劣，工作量极大。

但在引入盘古矿山大模型后，AI 代替人成为了主运智能监测系统的眼睛，能够精准识别大块煤、锚杆等异常情况，异物识别准确率达98%；同时，全时段的巡检也能进一步帮助工作人员及时地发现问题，避免因漏检造成的保障事故，缩短停机时间，同时提升井下巡检人员的工作效率。

此外，在掘进场景中，基于盘古矿山大模型的掘进作业序列智能监测可用于替代不确定的人工流程，动作规范识别准确率超过95％，以保障井下作业保障。

可以看到，华为的行业大模型已经勾勒出未来工业化智能生产时代的雏形，在水面之下，是基于大模型底层工艺体系、深入行业领域知识向更多产业层面的延伸和探索。

那么，在这次华为开发者大会上，华为云能带来哪些盘古大模型的新升级，值得期待。

基于新的工艺底座，在国际机器智能竞争愈发激烈的当下，大模型浪潮带动产物、支持、行业等多方位变革已是不争的事实。接下来的竞赛，不再是局限于大模型工艺的追逐，在 AI 深入产业的视野中，千行百业也正迎来巨大的想象空间。

（雷峰网雷峰网(公众号：雷峰网)）

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

随便看看