人工智能的未来:从数据、算法、算力到知识的融合

Author Tanmer 巴克励步
巴克励步 · 2025-03-05发布 · 1449 次浏览

人工智能的发展正在从纯粹的数据驱动走向数据与知识的融合。周志华教授提出的“反绎学习”为这一转变提供了理论框架和实践方法。随着AI技术进入新的阶段,知识的重要性将愈发凸显,未来的AI系统将不仅仅是“数据的奴隶”,而是能够充分利用人类智慧的智能体。

随着人工智能技术的飞速发展,数据、算法和算力构成了推动AI进步的三要素。然而,南京大学计算机系主任周志华教授在CCF-GAIR 2023的演讲中提出(见原文:周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!),未来的AI发展还需要加入“知识”这一关键要素。这一观点不仅为学术界和工业界的研究方向提供了新的思路,也为AI技术的进一步发展指明了方向。

数据、算法和算力的现状

当前的人工智能热潮主要依赖于机器学习,尤其是深度学习技术,这些技术在大数据和强大算力的支持下取得了显著进展。深度学习模型通过大量的数据和计算资源,能够达到远超研究者预期的性能。例如,OpenAI的GPT-3模型拥有1750亿参数,训练一次的成本高达1300万美元。这种“暴力美学”使得许多复杂任务,如自然语言处理,取得了突破性进展。
然而,这种“大力出奇迹”的方式也带来了高昂的成本,尤其是对于学术界而言,投入如此巨大的资源来提升模型的性能并不总是具有较高的回报。周志华教授认为,学术界和工业界应该在AI研究上有不同的分工:工业界可以专注于追求性能的提升,而学术界则应回归本源,致力于探索新的方向和思考未来的可能性。

知识的重要性:从数据驱动到知识驱动

周志华教授强调,未来的AI技术不仅需要数据、算法和算力,还需要“知识”。知识是凝聚了人类智慧的经验和规则,能够为AI系统提供更高的智能和解释能力。当前的AI技术主要依赖于数据驱动,尤其是在深度学习领域,模型通过大量的数据训练来学习特征和规律。然而,这种纯粹的“数据驱动”方式存在一定的局限性,尤其是在面对复杂任务或需要解释性决策的场景时。
👋
周志华教授提出的“反绎学习”(Abductive Learning)正是将数据驱动和知识驱动相结合的一种新范式。反绎学习通过引入逻辑推理,使机器学习在推理过程中能够更好地利用人类知识,从而提升模型的推理能力和解释性。

反绎学习:机器学习与逻辑推理的结合

反绎学习的核心思想是将机器学习的归纳能力与逻辑推理的演绎能力相结合。与传统的机器学习不同,反绎学习不仅仅依赖于数据,还通过引入知识库和逻辑推理来修正和优化模型的输出。例如,在破译玛雅历法的案例中,考古学家通过观察图像(数据)和利用已知的历法知识(知识库)进行反绎推理,最终得出了准确的结论。
反绎学习的应用不仅仅局限于历史破译,它还可以在医学诊断、决策支持等领域发挥重要作用。例如,在疫情防控中,AI模型可以通过结合医学专家的知识和大量的疫情数据,做出更加准确的分析和预测。

反绎学习的未来展望

反绎学习的提出为AI技术的未来发展提供了新的思路。它不仅能够提升AI系统的推理能力,还能够增强模型的解释性和可解释性。然而,反绎学习也面临一些挑战,例如如何构建高质量的知识库、如何设计高效的推理机制等。
在未来,随着知识图谱、自然语言处理等技术的进一步发展,反绎学习有望在更多的应用场景中发挥作用。同时,学术界和工业界的合作也将为反绎学习的落地提供更多的机会和资源。

从理论到实践

👋
原文描述:初始分类器未必要准确可靠,只不过用它把过程启动起来。当初始模型非常粗糙时,如果知识库的知识靠谱,那就能通过知识库的信息来修正分类器,能进行下去。如果知识不太精准,而初始模型比较好,也能往下学。如果两者都好,当然可以做得更好。也就是说,至少有一个好就能往下做。当然,如果数据没有label、初始分类器不靠谱、知识也不靠谱,那这样的任务本身就没法做。 
那接下来,这个知识库从哪来?这个目前还是需要人类专家来提供。最近一些关于知识图谱的工作能提供很多帮助。另外,有可能初始的知识并不是完美的,那么这个过程中,也可以通过对数据的学习来对知识做精化,所以反绎学习本身也可以认为是一个对知识精化的过程。
如上文所表达,从数据驱动到知识驱动的人工智能,知识库从哪里来? 如何做知识萃取,知识精华,以及知识图谱?这需要工具实践来完成。
Baklib (https://www.baklib.cn/)是一款 AI Ready 的知识库平台,其目的就是通过专家的角度,将多模态的知识(文本、图片、音视频、文档)从原子化到结构化再到图谱化,从人类可视、可管理的角度去整理、治理、清洗和完善。最终实现知识数字体验,以及对接 AI 模型,给 AI 提供数据燃料。
在Baklib等知识管理平台的帮助下,企业和研究机构可以更好地构建和利用知识库,推动反绎学习等新型AI技术的应用和落地。AI的未来,不仅是数据和算力的较量,更是知识与创新的融合。

参考文献:
  1. 周志华教授在CCF-GAIR 2023的演讲内容,来源:AI科技评论
提交反馈

博客 博客

专注数字内容治理,助力数字体验升级

知识中心支持 KCS :知识驱动客户成功

知识中心支持 KCS :知识驱动客户成功

知识中心支持(KCS)是以知识为核心资产的客户服务方法论,通过持续捕获、组织、复用、改进知识,帮助团队更快解决客户问题,降本增效,提升客户满意度。

Author knowledge-centered-support
By Lisa
发布:2026-06-18
如何打破信息孤岛以及这样做的好处

如何打破信息孤岛以及这样做的好处

信息孤岛会降低企业效率、造成重复劳动。本文介绍信息孤岛的成因、早期信号,并分享打破孤岛的实用方法:如5W1H分析、共享公司愿景、团队协作、培训、知识库(如Baklib)等。打破孤岛能提升生产力、协作能力和投资回报率。

Author break-down-information-silos-benefits
By Lisa
发布:2026-06-11
最全TOP 50 大模型 AI 知识库软件厂商排名汇总

最全TOP 50 大模型 AI 知识库软件厂商排名汇总

编者按:千行百业都在上大模型上 AI;同时我们也发现大模型+知识库是企业落地 AI 的最佳路径。所以我们通过汇总收集大模型+知识库的软件厂商,方便用户一窥究竟。内容持续更新中,排名不分先后~

Author top50
By 巴克励步
发布:2026-06-02
Baklib|为什么企业需要API驱动战略

Baklib|为什么企业需要API驱动战略

现代交易涉及35个系统组件,API成为连接关键。企业采用API驱动战略可降低开发成本、缩短上市时间、优化数字体验。本文解析API定义、商业价值及实施路径,助力企业赢在API经济时代。

Author api-driven-strategy-business
By Lisa
发布:2026-05-09
2026 年每个团队都需了解的 AI 文档的发展趋势

2026 年每个团队都需了解的 AI 文档的发展趋势

2026年AI文档将从静态转向自适应系统,包括MCP实时同步、多智能体协作、多模态内容、行业专用模型和集中治理。团队需防范AI幻觉、保持人工审核、管控文化差异,打好基础后再逐步引入新能力。

Author ai-documentation-trends-2026
By Lisa
发布:2026-05-08
AI时代,信任架构管理的复杂性

AI时代,信任架构管理的复杂性

AI时代,信任成为企业核心竞争力。真正的挑战不是技术老旧,而是系统复杂。AI会放大现有问题,信任必须从设计阶段融入架构。通过Baklib帮助企业打通数据、体验与治理,构建可信数字环境。

Author trust-architecture-ai-complexity
By Lisa
发布:2026-04-27
公共部门数字化转型的10个关键能力

公共部门数字化转型的10个关键能力

本文基于公共部门面临的数字化挑战,提出10项关键平台能力,涵盖多站点管理、低代码、自助服务、个性化、云端部署等,帮助政府提升服务效率与用户体验。

Author public-sector-digital-transformation-10-keys
By Lisa
发布:2026-04-20