天谋科技 CTO 乔嘉林博士:时序数据库 IoTDB 步入 2.0,3 大方向,9 大升级

7 月 5 日,2025 时序数据库技术创新大会在北京成功举办,收获强烈反响。本次大会以「下一站:DB + AI」为主题,汇集了超 30 位大咖嘉宾,学术界权威专家、企业代表、开发者围绕时序数据库 Apache IoTDB 的自研技术成果与应用落地实例,探讨工业物联网领域如何借助 AI 技术与数据库融合驱动智能化升级。

我们我们邀请到天谋科技 CTO,Apache IoTDB PMC Member 乔嘉林博士参加此次大会,并做主题报告——《IoTDB 2.0:AI 时代的工业数据智能底座》。以下为报告核心内容总结。

01 IoTDB 发展历程

自 2011 年诞生至今,IoTDB 始终围绕“管数”与“用数”两大核心维度持续演进。

在“管数”层面,IoTDB 完成了从工业时序数据库到分布式架构的发展,继而成功构建端边云协同能力,并于 2024 年登顶国际权威榜单。

乔嘉林博士认为,针对工业监控场景,数据价值随时间推移逐渐递减;而在 AI 驱动的智能分析时代,数据价值维度呈现多元化特征——反映设备状态、运行特性及工况特征的数据,无论新旧均可能成为高质量数据和关键分析对象。这种分析需求具有显著的大规模随机访问特性,让高效、可靠的数据基建成为了工业系统更加不可或缺的重要组成部分。

在“用数”层面,IoTDB 通过多项创新技术帮助用户充分释放数据价值。系统提供了持续查询语法和专门的质量库,确保分析数据质量。团队在 2023 年推出的 AI in SQL 功能,将人工智能能力深度集成到数据库内核中,而最新研发的内置时序大模型,更进一步让用户能够直接在数据库内完成复杂的时序数据建模与预测分析。

乔嘉林2025大会回顾图1-20250722.png

02 IoTDB 2.0 建立坚实数据基建

(1)树表双模型:写入灵活、查询丰富

乔嘉林博士指出,工业数字化转型初期,重点集中于数据的快速采集与统一管理。为此,IoTDB 针对工业设备层级提供树模型建模方式,使 OT 人员能够无缝将物理世界的数据组织结构映射至 IoTDB 中。

而随着工业数字化建设更加强调数据的规模化分析与利用,传统方案中 OT 实时监控与 IT 离线分析往往割裂,依赖高成本的 ETL 流程进行数据迁移与重整,效率受限。因此,IoTDB 2.0 致力于打破这一壁垒:通过引入表模型与关系 SQL 语言满足 IT 领域用户的分析习惯,同时实现树模型(OT 域)与表模型(IT 域)的深度融合与无缝衔接,推动两域数据能力的统一。

树表双模型的具体能力分为视图与实体两部分。视图方面,当数据接入时,IoTDB 2.0 可以采用树形结构进行数据组织和建模;需要进行数据分析时,系统允许用户通过简单的 SQL 语句在原始数据树上创建虚拟表视图。这一创新设计既不需要额外存储空间,又能实现树模型与表模型的自然映射。OT 侧的数采人员可以继续基于熟悉的树形结构进行数据操作,而 IT 侧的分析人员则能够直接使用标准 SQL 进行高效分析,实现了工业数据系统中 OT 与 IT 的深度融合。

乔嘉林2025大会回顾图2-20250722.png

实体方面,针对用户从传统关系型数据库(如 MySQL)或时序数据库(如 InfluxDB)迁移的需求,IoTDB 2.0 提供了动态宽表解决方案。与视图不同,用户可以创建实体表进行数据的读写操作,并实现无缝迁移。利用 IoTDB 树模型存储的灵活性,实体表支持动态扩展:新增测点时,表结构可以自动扩展且没有列数限制。传统数据库因列数限制(通常仅支持几千列)而需要复杂的分库分表操作,而 IoTDB 2.0 的动态宽表解决了这一痛点,真正实现了海量工业数据的无缝管理。

乔嘉林2025大会回顾图3-20250722.png

(2)高级分析能力:趋势查询、窗口函数、UDTF、嵌套查询

乔嘉林博士深入阐述了 IoTDB 2.0 在时序特性分析方面的四项创新能力。

第一项为趋势查询功能。针对工业场景中最核心的趋势分析需求,通过 IoTDB 2.0 的行模式匹配框架,用户可以直接通过 SQL 定义和识别时序模式,如上升、下降等基本子模式,并通过组合这些子模式描述完整的趋势变化。这种设计使得分析人员无需将数据读取至应用系统,就能直接在数据库内完成诸如波峰波谷检测、趋势变化分析等任务。

乔嘉林2025大会回顾图4-20250722.png

第二项为窗口函数功能。乔嘉林博士指出,时序数据的核心价值不在于单点取值,而在于特定时间窗口内的变化规律分析,包括趋势方向、变化斜率等深层特征。为此,IoTDB 2.0 扩展了窗口函数能力,支持用户使用 SQL 直接对时间窗口内的数据进行累计统计、趋势分析、斜率计算及异常检测等操作,方便设备状态监测等场景的深度分析。

乔嘉林2025大会回顾图5-20250722.png

第三项为 UDTF 功能。相较于传统时序数据库和关系型数据库仅支持标量函数(一对一转换)和聚合函数(多对一转换),IoTDB 2.0 引入了更强大的表值函数(UDTF)能力。这种 UDF 允许用户实现行列的自由定义和重组,将任意数据表通过自定义逻辑转换为结构完全不同的新表,特别适用于需要复杂转换的场景,例如将时序数据映射为包含多个频率分量的频谱分析结果。通过表值函数,IoTDB 真正实现了数据与计算的高度灵活融合,使工业数据分析范式从简单的数值转换升级为多维度的深度处理。

乔嘉林2025大会回顾图6-20250722.png

第四项为嵌套查询功能。乔嘉林博士以“查询大于平均值的电压数据”这一典型场景为例,指出传统实现方式需要分两步完成:首先查询平均值,再构造新查询获取大于平均值的原始数据。这种实现不仅增加了业务编程复杂度,还增加了应用系统与数据库之间的网络交互。

IoTDB 2.0 通过嵌套查询,允许用户用单条 SQL 语句进行逻辑嵌套,完成这类复杂的数据处理。这种设计显著简化了应用开发流程,减少了系统间交互开销,特别适合工业场景中常见的多层数据分析需求,使开发人员能够更高效地实现复杂业务逻辑。

乔嘉林2025大会回顾图7-20250722.png

(3)动静融合:支持设备静态属性存储

乔嘉林博士特别强调,虽然 IoTDB 已在表模型基础上构建了丰富的时序查询分析语法,但 2.0 版本的愿景远不止于此。面对 AI 时代的数据分析新挑战,尽管时序数据作为“工业血液”占据了工业数据主要体量,支持了大部分设备状态分析,但实际业务场景往往需要进一步跨维度关联分析,例如分析雨天对设备运行的影响,或特定电压阈值下的设备状态等。这些需求都要求突破单一时序数据的局限,实现多源数据的智能融合。

正是基于这样的洞察,IoTDB 2.0 将“关联与融合”确定为核心发展目标,致力于构建更完整的工业数据分析解决方案,帮助用户从多元数据中挖掘更深层的业务价值,并重点突破了三大关键技术方向。

针对用户长期反映的设备静态属性管理需求,IoTDB 2.0 在表模型基础上进行了关键性扩展,支持了静态属性数据入表存储。这些不随时间变化的设备固有属性(如型号、出厂配置等)可以与动态时序数据深度关联,形成独特的“动静融合表”,用户可以直接在单张表中实现静态属性过滤、时序与静态数据关联分析等能力。

乔嘉林2025大会回顾图8-20250722.png

(4)模态融合:支持对象/文件管理

针对工业场景中普遍存在的非结构化对象/文件(如设计图纸、BOM 清单、图像视频等)管理需求,IoTDB 2.0 创新性地在数据模型中引入了对象类型支持,改变了传统方案中时序与文件存储割裂的困境。与二进制存储(如 Blob)不同,对象类型允许用户以业务熟悉的格式自定义存储和解析文件,并利用 IoTDB 的查询能力实现文件内容的高效检索与分析。

以飞机试飞场景为例,IoTDB 2.0 可同时管理试飞时序数据、技术文档、图像、视频等多模态数据,在统一数据空间内实现管理与分析,为复杂工业场景提供了多模态数据管理方案。

乔嘉林2025大会回顾图9-20250722.png

(5)关联融合:支持跨库联邦查询

面对工业场景中数据分散于多个数据库(如 MySQL、Hive、HBase 等)的挑战,IoTDB 2.0 在融合查询引擎中新增了联邦查询模块,能够无缝接入外部数据源中的业务数据(如生产排程、出厂设置等),并与本地的时序数据、设备静态属性进行关联。用户可直接通过 SQL 实现跨系统、多模态数据分析,避免了传统方案中需要在业务层手动整合不同数据库数据的繁琐流程,运营数据与运行数据的融合为智能制造提供了全域数据协同能力。

乔嘉林2025大会回顾图10-20250722.png

03 IoTDB 2.0 拓展 AI 时代智能基建

乔嘉林博士深入剖析了 AI 时代工业智能化面临的核心挑战与 IoTDB 提供的解决方案。他指出,尽管大模型技术蓬勃发展,但通用模型在工业领域的应用始终面临两大根本性障碍:一是缺乏对设备机理和领域知识的深度理解,二是受限于数据质量对模型效果的直接影响。

针对这些问题,IoTDB 基于十余年的工业数据管理经验,构建了双轮驱动的智能基建体系:一方面通过数据节点 DataNode 实现工业数据的统一建模、质量提升和高效处理,夯实数据基础;另一方面通过智能分析节点 AINode 引入模型微调功能,将通用大模型转化为面向特定工业场景的专用模型。这种“高质量数据+领域微调”的方案,有效弥合了通用 AI 技术与工业专业知识之间的鸿沟,为真正解决设备状态预测、故障诊断等专业问题提供了可行路径。

(1)AINode 数据智能架构

IoTDB 2.0 AINode 智能数据架构分为模型管理、数据预处理、训练引擎、推理引擎四部分。模型管理层以自研时序大模型 Timer 为核心,针对工业场景特有的设备状态分析需求,构建深度学习、机器学习、用户模型体系。

在大模型基础上,数据预处理层通过时间对齐、频率规整、缺失值填补等技术,将原始时序数据转化为大模型可用的高质量数据训练集。

架构上层中的训练引擎支持大模型一键微调,并可进行多轮训练与评估,以选择最优模型版本;推理引擎则支持大模型缓存机制,通过预加载已调优的领域大模型,显著提升了实时推理的计算效率。

值得一提的是,用户使用一条 SQL 指令即可在 IoTDB 2.0 中完成大模型微调:只需通过 FROM MODEL 子句指定基础模型,结合 DATASET 子句指定训练数据集(如特定设备的增量运行数据),即可实现大模型的持续在线更新,保持其对设备最新状态的精准刻画。

乔嘉林2025大会回顾图11-20250722.png

(2)快速构建领域时序大模型

乔嘉林博士生动阐释了 IoTDB 2.0 AINode 如何通过“一键微调”能力,将时序大模型的训练门槛降至新低。传统流程中,开发者需要手动导出数据、清洗转换、编写训练代码,整个过程繁琐且技术要求较高;而 AINode 的设计真正实现了“手可摘星辰”般的易用性,使得每位工业用户都能基于自有数据,快速构建专属的领域时序大模型。

以秒级采集的工业设备数据为例,单卡仅需 5 分钟即可完成天级增量学习,微调后的模型在 MSE(均方误差)指标上提升超 20%。微调效果对比显示:微调前的预测结果与真实设备状态存在显著偏差,而经过领域数据微调后的模型则能精准捕捉设备机理特性。

这也体现了工业时序数据与语言数据在算法方面的本质差异:预测设备状态变化需要学习历史数据规律,而非依赖语言逻辑。

乔嘉林2025大会回顾图12-20250722.png

(3)IoTDB 2.0:AI 时代的工业数据智能底座全景图

乔嘉林博士系统展示了 IoTDB 2.0 作为面向 AI 时代的工业智能数据底座的整体架构。该平台采用三层核心设计:DataNode 作为数据基建,统一管理时序数据、静态属性、多模态对象及外部联邦数据;AINode 专注智能化能力,提供时序大模型管理、数据预处理和模型微调等智能分析支持;由 ConfigNode 实现 DataNode 与 AINode 的系统管理,负责资源协同调度,确保各组件高效协作。基于这一架构,IoTDB 2.0 向上支撑智能体构建、智能运维、时序预测、异常检测等应用场景。

乔嘉林2025大会回顾图13-20250722.png

产品形态上,IoTDB 2.0 以专业时序数据库为主体,搭配即插即用的联邦查询组件和智能分析组件,形成“一体两翼”的灵活解决方案,满足工业用户从基础数据管理到高级智能分析的全栈需求。

乔嘉林2025大会回顾图14-20250722.png

04 IoTDB 2.0 集成开放全链路生态

(1)基于 IoTDB 2.0 的智能应用:自动完成业务分析

乔嘉林博士通过合作伙伴虚拟电厂电池管理的实际案例,生动展示了 IoTDB 2.0 “数据+AI”双基建设施的实践价值。该业务涵盖三类分析场景:日常统计指标计算、充放电故障分类排序、未来趋势预测,这些需求往往具有临时性和非标准性。传统解决方式需耗费 2-3 天/次进行人工数据提取和处理,若要实现标准产品化则需数周开发周期。

通过深度合作,团队基于 IoTDB 2.0 构建了智能应用方案:基于自然语言交互,大模型可自动理解并生成 IoTDB 中的 SQL 语句,结合内置的趋势分析、嵌套查询等功能,实现对多源数据(时序数据、静态属性、业务知识库等)的智能关联分析,并能将业务知识进行存储、可视化,形成分析闭环。

乔嘉林2025大会回顾图15-20250722.png

基于构建的业务知识体系,当用户输入针对特定场景的业务问题与分析特征时,时序大模型将自动解析需求并生成精准的 SQL 语句,即时提取 IoTDB 中的目标原始数据并生成可视化预览,确保分析范围正确。

乔嘉林2025大会回顾图16-20250722.png

之后,IoTDB 系统将结合业务知识库中的多源数据信息,对原始数据进行进一步理解与加工,最终输出面向该特定场景问题的完整分析报告。这一流程将传统人工分析的“数据读取-清洗-分析”过程简化为即时交互的智能服务,不仅显著提升了分析效率,大模型生成结果更能为人工分析提供智能化参考依据。

乔嘉林2025大会回顾图17-20250722.png

(2)扩展软硬件全域生态系统

同时,IoTDB 构建了覆盖数据全生命周期的生态系统,包含数据采集、数据集成、计算引擎和可视化分析四大核心环节。完整的数据生态确保用户在使用 IoTDB 时,能够根据具体需求与各类工具和平台无缝集成,这种开放性和扩展性使得用户能够基于 IoTDB 创造超出预期的创新应用,充分释放工业数据智能化的潜在价值。

乔嘉林2025大会回顾图18-20250722.png

乔嘉林博士重点介绍了 IoTDB 在硬件生态领域的扩展布局。IoTDB 与深开鸿深度集成的边缘智能硬件板,实现了百万点/秒的高吞吐写入、毫秒级查询响应与高压缩比,结合其轻量化特性,适用于智能边缘物联网的数据管理分析场景。

乔嘉林2025大会回顾图19-20250722.png

IoTDB 联合航天巨恒与北科大集成系统控制器,该控制器专为钢铁热轧产线及交通等实时控制场景设计,核心优势在于采用国产 CPU 并实现微秒级实时控制。在钢铁热轧等对精度要求极高的工业场景中,系统支持微秒级全量数据采集,将原始数据实时存储于端侧板卡并同步上传,有效解决了传统端侧设备仅能执行控制指令而无法储存数据的痛点。

乔嘉林2025大会回顾图20-20250722.png

更突破性的是 IoTDB 智能一体机的推出:采用全国产化硬件,预集成 IoTDB 与时序大模型核心功能,秒级测点管理能力达到 1 亿点以上,达到亿级写入/查询吞吐、毫秒级写入/查询延迟、数十倍压缩比、十年以上数据留存等性能表现,真正实现了开箱即用的智能数据基础设施。

这些硬件生态合作标志着 IoTDB 从软件系统向“软硬协同”生态的跨越,使工业数据智能能力具象化为可部署的实体解决方案。

乔嘉林2025大会回顾图21-20250722.png

05 IoTDB 未来技术路线

报告的最后,乔嘉林博士展望了 IoTDB 的未来发展方向。基于用户反馈与技术演进需求,团队将聚焦四大核心目标:第一,使用简便,通过智能化交互持续降低使用门槛,降低用户的手工操作压力;第二,模态融合,突破时序数据边界,实现多维数据的统一治理;第三,安全保障,构建防攻击、防泄露的全方位数据安全机制;第四,极致稳定,作为隐形的平台基础内核工具,让 IoTDB 以“无感知”的可靠性高效支撑上层应用。

他特别强调,从早期工业用户的期待,到如今成为钢铁、电力、航空等关键领域的数字基座,用户的认可始终是驱动 IoTDB 迭代前进的核心动力。未来团队将继续深耕工业场景,让 IoTDB 真正成为支撑中国工业数智化的中坚力量。

乔嘉林2025大会回顾图22-20250722.png

更多内容推荐:

• 下载开源时序数据库 IoTDB

• 咨询企业版

• 回顾 IoTDB 2025 大会全内容