人工智能的未来:从数据、算法、算力到知识的融合

Author Tanmer 巴克励步
巴克励步 · 2025-03-05发布 · 1275 次浏览

人工智能的发展正在从纯粹的数据驱动走向数据与知识的融合。周志华教授提出的“反绎学习”为这一转变提供了理论框架和实践方法。随着AI技术进入新的阶段,知识的重要性将愈发凸显,未来的AI系统将不仅仅是“数据的奴隶”,而是能够充分利用人类智慧的智能体。

随着人工智能技术的飞速发展,数据、算法和算力构成了推动AI进步的三要素。然而,南京大学计算机系主任周志华教授在CCF-GAIR 2023的演讲中提出(见原文:周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!),未来的AI发展还需要加入“知识”这一关键要素。这一观点不仅为学术界和工业界的研究方向提供了新的思路,也为AI技术的进一步发展指明了方向。

数据、算法和算力的现状

当前的人工智能热潮主要依赖于机器学习,尤其是深度学习技术,这些技术在大数据和强大算力的支持下取得了显著进展。深度学习模型通过大量的数据和计算资源,能够达到远超研究者预期的性能。例如,OpenAI的GPT-3模型拥有1750亿参数,训练一次的成本高达1300万美元。这种“暴力美学”使得许多复杂任务,如自然语言处理,取得了突破性进展。

然而,这种“大力出奇迹”的方式也带来了高昂的成本,尤其是对于学术界而言,投入如此巨大的资源来提升模型的性能并不总是具有较高的回报。周志华教授认为,学术界和工业界应该在AI研究上有不同的分工:工业界可以专注于追求性能的提升,而学术界则应回归本源,致力于探索新的方向和思考未来的可能性。

知识的重要性:从数据驱动到知识驱动

周志华教授强调,未来的AI技术不仅需要数据、算法和算力,还需要“知识”。知识是凝聚了人类智慧的经验和规则,能够为AI系统提供更高的智能和解释能力。当前的AI技术主要依赖于数据驱动,尤其是在深度学习领域,模型通过大量的数据训练来学习特征和规律。然而,这种纯粹的“数据驱动”方式存在一定的局限性,尤其是在面对复杂任务或需要解释性决策的场景时。

👋

周志华教授提出的“反绎学习”(Abductive Learning)正是将数据驱动和知识驱动相结合的一种新范式。反绎学习通过引入逻辑推理,使机器学习在推理过程中能够更好地利用人类知识,从而提升模型的推理能力和解释性。

反绎学习:机器学习与逻辑推理的结合

反绎学习的核心思想是将机器学习的归纳能力与逻辑推理的演绎能力相结合。与传统的机器学习不同,反绎学习不仅仅依赖于数据,还通过引入知识库和逻辑推理来修正和优化模型的输出。例如,在破译玛雅历法的案例中,考古学家通过观察图像(数据)和利用已知的历法知识(知识库)进行反绎推理,最终得出了准确的结论。

反绎学习的应用不仅仅局限于历史破译,它还可以在医学诊断、决策支持等领域发挥重要作用。例如,在疫情防控中,AI模型可以通过结合医学专家的知识和大量的疫情数据,做出更加准确的分析和预测。

反绎学习的未来展望

反绎学习的提出为AI技术的未来发展提供了新的思路。它不仅能够提升AI系统的推理能力,还能够增强模型的解释性和可解释性。然而,反绎学习也面临一些挑战,例如如何构建高质量的知识库、如何设计高效的推理机制等。

在未来,随着知识图谱、自然语言处理等技术的进一步发展,反绎学习有望在更多的应用场景中发挥作用。同时,学术界和工业界的合作也将为反绎学习的落地提供更多的机会和资源。

从理论到实践

👋

原文描述:初始分类器未必要准确可靠,只不过用它把过程启动起来。当初始模型非常粗糙时,如果知识库的知识靠谱,那就能通过知识库的信息来修正分类器,能进行下去。如果知识不太精准,而初始模型比较好,也能往下学。如果两者都好,当然可以做得更好。也就是说,至少有一个好就能往下做。当然,如果数据没有label、初始分类器不靠谱、知识也不靠谱,那这样的任务本身就没法做。 

那接下来,这个知识库从哪来?这个目前还是需要人类专家来提供。最近一些关于知识图谱的工作能提供很多帮助。另外,有可能初始的知识并不是完美的,那么这个过程中,也可以通过对数据的学习来对知识做精化,所以反绎学习本身也可以认为是一个对知识精化的过程。

如上文所表达,从数据驱动到知识驱动的人工智能,知识库从哪里来? 如何做知识萃取,知识精华,以及知识图谱?这需要工具实践来完成。

Baklib (https://www.baklib.cn/)是一款 AI Ready 的知识库平台,其目的就是通过专家的角度,将多模态的知识(文本、图片、音视频、文档)从原子化到结构化再到图谱化,从人类可视、可管理的角度去整理、治理、清洗和完善。最终实现知识数字体验,以及对接 AI 模型,给 AI 提供数据燃料。

在Baklib等知识管理平台的帮助下,企业和研究机构可以更好地构建和利用知识库,推动反绎学习等新型AI技术的应用和落地。AI的未来,不仅是数据和算力的较量,更是知识与创新的融合。


参考文献:

  1. 周志华教授在CCF-GAIR 2023的演讲内容,来源:AI科技评论

  2. Baklib官网:Baklib: 知识管理与文档协作平台

提交反馈

博客 博客

专注数字内容治理,助力数字体验升级

如何计算网页内容管理系统的投资回报率

如何计算网页内容管理系统的投资回报率

本文通俗讲解如何计算网页内容管理系统(WCM)的投资回报率。通过分类任务与资源、对比新旧系统耗时与成本,并结合“软性回报”(如员工满意度),帮您做出客观评估。核心是用实际数据,关注团队增效而非单纯减员,为采购或升级系统提供可靠依据。

Author calculate-wcm-roi-guide
By Lisa
发布:2026-03-20
数字化转型的三大障碍及解决方案

数字化转型的三大障碍及解决方案

本文探讨了企业在数字化转型过程中面临的三大核心挑战:紧迫感缺失、客户价值忽视以及文化变革困难。通过Baklib的实践经验,为企业提供从技术到组织的全方位转型指导,助力实现真正的业务变革。

Author three-hurdles-to-digital-transformation
By Lisa
发布:2026-03-20
客户体验保持一致性的三大关键策略

客户体验保持一致性的三大关键策略

企业面临用户期望高、渠道多的挑战。本文提出移动优先设计、单一平台方法及单一客户视图三大策略,帮助企业整合触点、统一体验,构建连贯的客户旅程,在竞争中脱颖而出。

Author 7b6b
By Lisa
发布:2026-03-10
如何让网站具备数字敏捷性?AI+低代码+多站点管理实战

如何让网站具备数字敏捷性?AI+低代码+多站点管理实战

数字化转型时代,网站僵化将成为业务增长的最大阻碍。本文详解如何通过AI智能、低代码开发、多站点统一管理和头分离架构,让企业网站获得真正的数字敏捷性,快速响应市场变化,提升用户体验与运营效率。

Author digital-agility-website-guide
By Lisa
发布:2026-03-05
Baklib DXP七大优势:简化技术栈,赋能企业数字化转型

Baklib DXP七大优势:简化技术栈,赋能企业数字化转型

本文深入剖析了超过1200家企业选择Baklib DXP的七大核心原因。从简化技术栈、随需应变的演进能力,到多场景解决方案、减轻IT负担,再到高度安全性及灵活的部署方式,全面展示Baklib如何帮助企业构建AI-Ready的数字体验平...

Author 7-reasons-why-our-customers-choose-baklib-dxp
By Lisa
发布:2026-03-04
Baklib|内容中心:企业全渠道增长引擎

Baklib|内容中心:企业全渠道增长引擎

在信息过载与注意力稀缺的时代,内容中心成为企业提升营销效率与品牌一致性的关键基础设施。通过集中管理内容资产、强化治理机制、实现全渠道分发与个性化推荐,企业能够提升协作效率、保障品牌安全,并持续增强用户参与度与转化能力。

Author content-hub-digital-marketing-upgrade
By Lisa
发布:2026-02-27
如何衡量知识库投资回报率(ROI)及其业务影响

如何衡量知识库投资回报率(ROI)及其业务影响

本文结合权威研究数据,解析企业因信息质量与知识孤岛造成的隐性成本,系统拆解知识库ROI的核心衡量指标,包括工单减少、处理效率、可发现性、客户体验与产品采用率,并提供向管理层证明ROI的实用框架,帮助企业将知识库从成本中心转变为可衡量的...

Author measure-knowledge-base-roi
By Lisa
发布:2026-02-24
全网最全的TOP 100 数据要素公司汇总

全网最全的TOP 100 数据要素公司汇总

本文旨在梳理数据要素市场的核心参与者,分析其技术优势与应用场景,共同构建安全、可信、高效的数据要素流通生态。

Author sjys
By 巴克励步
发布:2026-02-15