荀子古籍大语言模型

2个月前发布 11 00

荀子古籍大语言模型是南京农业大学信息管理学院王东波教授团队在北京发布的进行古籍处理和研究的智能工具。,荀子古籍大语言模型是南京农业大学信息管理学院王东波教授团队在北京发...

收录时间:
2024-09-11
荀子古籍大语言模型荀子古籍大语言模型
荀子古籍大语言模型

荀子系列模型是什么?

随着科技的飞速发展,人工智能已深入到各个领域。为响应古籍活化利用号召,推动大语言模型与古籍处理深度融合,以古籍智能化的研究为目的,南京农业大学国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”课题组与中华书局古联公司推出了一系列古籍处理领域大语言模型:荀子古籍大语言模型。

荀子不仅是我国先秦时期伟大的朴素唯物主义的思想家,也是一位散文大家。他在语言学理论的阐述上又是一位开拓者、奠基人。荀子系列专为古籍智能处理而设计,这一系列模型的推出将推动古籍研究与保护工作的新发展,提高中华传统文化传承的效率与质量。

“荀子”古籍大语言模型整合了包含《四库全书》在内绝大多数传世古籍文献在内的超过20亿字的语料库。它以推动古籍研究和保护创新发展、提高中华传统文化传承效率和质量、实现大语言模型与古籍处理深度融合为宗旨。

本次荀子系列模型开源包括两个部分:基座模型XunziALLM与对话模型XunziChat,模型的调用方式与阿里云的Qwen系列大模型一致。用户可以在GitHub和ModelScope等网站免费下载使用。

荀子系列模型可以做什么?

荀子系列模型主要功能包括:智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析、自动标点等,可显著提高古籍处理和研究的效率。

  • 古籍智能标引,荀子模型具备强大的古籍文献标引能力,能够对古籍中的内容进行高质量主题标引,帮助研究人员快速了解文章主题。

荀子古籍大语言模型

  • 古籍信息抽取,荀子模型能够自动从古籍中抽取关键信息,如人物、事件、地点等,大大节省了研究人员的信息整理时间。

荀子古籍大语言模型

  • 诗歌生成:荀子模型还具备诗歌生成的能力,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感。

荀子古籍大语言模型

  • 古籍高质量翻译:对于那些难以理解的古籍文献,荀子模型能够提供高质量的翻译服务,帮助研究人员更好地理解原文含义。

荀子古籍大语言模型

  • 阅读理解:荀子模型能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读。

荀子古籍大语言模型

  • 词法分析:荀子模型可以完成古籍文本的自动分词和词性标注,能够有效提升语言学工作者的研究效率。

荀子古籍大语言模型

  • 自动标点:荀子大模型可以快速完成古籍文本的断句和标点,提升研究者以及业余爱好者对古籍文本的阅读体验。

荀子古籍大语言模型

由于我们同时发布了基座模型,用户也可以根据自己的需求,使用本地的训练语料微调荀子基座模型,使得其能够在古籍下游处理任务上取得更佳的处理性能。

如何使用荀子大模型?

你可以在GitHub和ModelScope等网站免费下载使用。

数据统计

相关导航

阅文妙笔大模型:国内首个网文大模型

阅文妙笔大模型:国内首个网文大模型

在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能”。,在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能…
Yi大模型-零一万物发布的开源大模型

Yi大模型-零一万物发布的开源大模型

Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。,Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。
携程问道:首个旅游行业垂直AI大模型

携程问道:首个旅游行业垂直AI大模型

7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户提出想法,问道可从地域、主题特色等维度,推荐旅行目的地、酒店、景点、行程规划和实时优惠的选项; 在用户需求相对明确时,提供智能查询结果,用户可用文字和语音以自然语言长句的形式进行复杂条件的机票和酒店产品的查询。 携程集团董事局主席梁建章表示,“希望用户从包括‘携程问道’在内的产品获得旅游行业‘可靠的内容,放心的推荐’。,7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户…
GPT-4-OpenAI旗下AI大模型

GPT-4-OpenAI旗下AI大模型

GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。,GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。
讯飞星火语音大模型

讯飞星火语音大模型

讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出。该模型适用于语音搜索、聊天输入、游戏娱乐、人机交互、智能客服等多个场景,为企业和开发者提供了强大的语音交互解决方案。,讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出…