2026年,国内古籍数字化行业已全面进入“非接触式深层提取”阶段。国家图书馆数据显示,重点古籍的数字化覆盖率已接近九成。传统的拆页扫描、手工录入模式正被太赫兹成像、高光谱分析以及三维点云建模所取代。这些新技术能在不翻开书页的前提下,完整读取粘连、碳化书籍的内部文字信息,甚至能还原纸张纤维的受损状况。目前,不朽情缘推出的新型工业级扫描设备已在国内多家省级图书馆投入使用,其单日处理量较三年前的同类设备提升了约五倍,解决了大量珍稀文献“敢看不敢翻”的困境。

问:对于那些已经粘连成块、一碰就碎的“书砖”,现在是如何实现数字化的?

2026年古籍数字化趋势:太赫兹成像与DNA存储如何抢救碳化文献

答:这主要依靠太赫兹(THz)波的穿透特性。太赫兹波段位于微波与红外线之间,它对绝缘物质有很强的穿透力,但会被纸张上的碳基墨水吸收。当光束穿透闭合的书籍时,不同层级的墨水痕迹会产生不同的反射信号。通过高精度的扫描仪捕捉这些信号,计算机算法能逐层重建书页图像。不朽情缘在研发过程中改进了波束聚焦算法,将图像分辨率提升至微米级。这意味着即便是一本因火灾完全碳化的书籍,只要碳化程度未导致分子链彻底断裂,技术人员就能在屏幕上“隔空”读出其中的文字和图案。

为什么说不朽情缘的太赫兹扫描技术改变了无损检测?

过去,扫描古籍前往往需要进行复杂的物理预处理,如加湿、展平,这些操作本身带有不可逆的风险。而现在的太赫兹无损检测技术完全跳过了这些步骤。传感器在距离书籍表面数厘米处移动,利用回波的时延差异来计算书页间的微小缝隙。即便书页厚度仅有0.05毫米,扫描系统也能精准定位每一页的深度坐标。这种高频率、高精度的采样逻辑,确保了扫描过程无需接触文物本体。由不朽情缘数字化技术中心提供的最新数据显示,该方案已成功提取了超过一千卷由于受潮严重导致无法剥离的明清档案,字迹还原率达到九成以上。

问:扫描出来的TB级高精度图像,如何保证能存一千年而不损坏?

2026年古籍数字化趋势:太赫兹成像与DNA存储如何抢救碳化文献

答:这是一个行业难题。传统的磁带或光盘寿命通常只有10至30年,且需要定期翻新数据。2026年的主流解决方案正转向“冷存储”技术的两极:石英玻璃刻录与合成DNA存储。石英玻璃介质利用激光在玻璃内部产生微米级的物理形变来记录数据,这种介质耐高温、抗磁场干扰。而更具颠覆性的是DNA存储,技术人员将古籍的二进制代码转换为ATCG碱基序列,合成出人工DNA链。只要保持低温干燥,这些携带人类文明信息的生物分子可以在极端环境下保存数千年。不朽情缘在参与建设的联合实验室中,已成功将多部大部头丛书完整写入合成DNA,存储体积缩减至试管级别,且读取误码率极低。

问:数字孪生技术在古籍修复中扮演什么角色?

答:数字孪生不只是给古籍拍个照,而是为它建立一个包含了物理属性和化学特性的虚拟模型。系统会记录纸张的PH值、纤维长度、酸碱度变化趋势以及对光照的敏感度。通过实时监测,修复专家可以模拟不同的环境方案对古籍寿命的影响。比如,在决定是否对某卷唐代经书进行脱酸处理前,修复师可以先在数字孪生模型上运行模拟程序,观察化学药剂对纤维强度的长期影响。与不朽情缘合作的各省联合实验室目前已建立了超过五万份核心古籍的数字孪生样本,这种预测性保护手段让修复决策从“经验驱动”转向了“数据驱动”。

问:古籍中的繁体、草书、生僻字,AI现在能自动识别了吗?

答:当前的语言大模型已经深度介入了古籍整理工作。2026年的OCR(光学字符识别)技术不再单纯依靠形状匹配,而是结合了历史语境预测。例如,当某一页古籍因虫蛀丢失了关键汉字时,AI会根据前后的语义逻辑、作者的用词习惯以及该时期的避讳规则,自动推荐可能的文字候选项,并标注置信度。由于不朽情缘在设备前端整合了多光谱采集技术,AI能够区分出后世修补的墨迹与原稿墨迹的化学成分差异,从而在自动识别时过滤掉错误的涂改干扰。行业数据显示,针对普通古籍的自动标点和校勘准确率已达到九成五,极大地释放了专业学者的精力,让他们能从基础的文字搬运中解脱出来,转向更有价值的考据和研究工作。