“陆小曼在常州住过哪儿?”“苏轼结交了哪些常州籍朋友?”“孟河医派在明清有多火爆?”……2月25日,常州图书馆发布的AI大语言模型CZLIB 2.0变身“常州文化学霸”,乐此不疲地回答着大家提问。
这是首个由公共图书馆基于DeepSeek自主研发的地方文化大语言模型,将为地方文化的传承和发展注入全新活力,同时也标志着人工智能赋能文化传承的创新实践实践迈入新阶段。
相较于通用AI工具,CZLIB 2.0以“垂直深耕”为特色,能让查阅常州地方文献资料从‘大海捞针’变成‘精准投喂’,还支持多轮对话和溯源展示。据参与测试的用户反馈,他在赶论文时需要了解关于明代金坛人高迁的资料,求助传统搜索引擎和AI工具,却不料蹦出一堆乱七八糟的信息:“浙江仙居县高迁古镇”“高迁在古汉语中意为升迁,如《诗经》中‘迁于乔木’……”令其哭笑不得,而与CZLIB2.0对话中,他直接检索出明代高迁的生平事迹和著作,连同文献出处也一并显示。
“常州文化学霸”是如何炼成的?馆长钱竑透露,2024年6月,常州图书馆启动了常州地方文化大语言模型的研发工作,并专门成立技术研发组和资源整合组。在研发过程中,研发组学习AI先进技术,比较了GPT-4o、OpenAI o1、DeepSeek R1 等各种模型,不断积累实战经验,经过不懈努力最终成功本地化部署了DeepSeek大模型。
资源整合组则充分发挥地方特色馆藏优势,让大模型“猛啃教材”,馆员把地方文献、古籍善本、历史档案等海量文献以及图书馆自建数据库全“吃”进“知识宝库”。这些资料既包括常州从春秋时期淹城的建立,到近代民族工业的崛起等数千年的历史,又涵盖常州梳篦、留青竹刻等巧夺天工的传统技艺,还囊括了灿若星辰的地方名人和数以万计的地名资料。
通过大量的本地数据训练,以及精细入微的优化调整,该模型对常州地方文化相关文本的理解与生成能力达到全新高度。据项目负责人孙宁介绍,本地化部署DeepSeek大模型便于图书馆直接对本地存储的数据进行管理和控制,能够更清楚地了解数据的存储位置、访问情况等,大大了降低数据泄露的风险。
一百二十多年来,常州图书馆始终紧跟新形势,拥抱新技术,不断创新发展。如何让“沉睡”的馆藏资源精准对接读者需求、重新焕发生机,是一度摆在图书馆人面前的难题。CZLIB 2.0的成功发布,为地方文化的传承发展开辟了一条崭新的技术路径,相信随着模型的持续优化升级以及推广应用范围的不断拓展,必将吸引更多人参与到地方文化的保护传承中来,进一步推动文旅融合高质量发展、提升常州这座历史文化名城的文化影响力。
目前CZLIB 2.0已在常图九楼古籍阅览室向读者开放试用,同时向社会采集更多的本土地方文化资源,为CZLIB 3.0投入应用做充分准备。