司农大语言模型:南京农业大学开源的国内首个通用农业领域垂直AI大模型
一、司农大语言模型是什么
司农大语言模型(Sinong)是由南京农业大学联合南京理工大学研发的国内首个通用农业领域开源垂直大语言模型,依托超40亿token的农业领域高质量数据集训练构建,提供8B和32B两种参数版本并完全开源。该模型针对通用大模型在农业领域的“幻觉问题”和知识滞后性进行技术攻坚,创新推出多智能体检索增强(RAG)框架,同时融合思维链、上下文参考等多维训练方式,大幅提升对农业专业知识的理解与分析能力。模型覆盖动物科学、作物育种、农业经济等多个农业细分领域,可广泛应用于农业科研、教育、生产等场景,有效降低农业AI应用门槛,为智慧农业发展提供技术支撑。
“司农”一名取自中国古代财政与农业管理官职体系,其核心定位是深度服务农业全领域,解决通用大语言模型在农业专业场景中“懂而不精”的问题。通用大语言模型虽具备广泛的文本生成能力,但面对农业领域的专业问题时,往往存在回答模棱两可、信息不准确、知识更新不及时等弊端,而司农大语言模型则专门针对这些痛点进行研发,从数据、技术、模型架构等多方面实现农业领域的精准适配。
模型的研发依托南京农业大学在农业领域的顶尖学科优势,覆盖动物科学、动物医学、农业经济管理、智慧农业、作物育种、园艺学、植物保护、农业资源与环境等几乎所有农业细分学科方向,旨在打造一个“懂农业、知农事、解农忧”的AI智能助手,为农业科研工作者、教育从业者、生产实践者等提供专业的知识支持与决策参考。
目前,司农大语言模型1.0版本已完成研发并正式开源,提供8B和32B两种参数规模的版本,用户可免费下载、部署和二次开发,研发团队还开放了数据合作渠道,进一步降低了农业AI技术的应用门槛。
二、功能特色
司农大语言模型作为农业领域的专属垂直大模型,与通用大语言模型相比,在功能上具备鲜明的农业领域特色,核心优势集中在知识专业性、回答准确性、应用实用性三个维度,具体功能特色如下:
(一)全覆盖的农业领域知识储备
司农大语言模型的训练数据涵盖农业全领域的权威知识,构建了体系完整、质量过硬的农业基础数据集,避免了通用大模型在农业知识上的“短板”。模型不仅掌握基础的农业生产知识,还深入理解农业科研、政策法规、行业标准等专业内容,能够应对不同农业细分场景的知识查询需求。例如,既可以回答“小麦纹枯病的防治方法”这类生产问题,也能解析“农业农村部最新耕地保护政策”这类政策问题,还能解读“作物育种中的分子标记技术”这类科研问题。
(二)智能化的知识分析与推理能力
不同于传统农业知识库的“关键词匹配式”回答,司农大语言模型具备深度的分析与推理能力,通过引入思维链(COT)和上下文参考(Incontext)等训练方式,能够对农业问题进行逻辑化、系统化的解答。例如,当用户询问“宋代南方水田的新农具及其作用”时,模型不仅能列出曲辕犁、龙骨水车等农具名称,还能一步步分析这些农具如何适应南方水田的地理特征、如何提升水稻种植的生产效率;当用户提供一段小麦种植的田间数据时,模型能结合上下文分析温湿度、施肥量、种植密度等因素对小麦产量的影响,并给出针对性的优化建议。
(三)高可信度的无幻觉回答输出
针对通用大模型普遍存在的“幻觉问题”——即生成看似合理但实际错误的内容,司农大语言模型通过多智能体检索增强框架从根本上解决这一痛点。模型在回答问题时,会先从权威知识库中检索相关参考资料,再基于这些资料生成答案,同时为答案标注信息来源,如同写论文附带参考文献一般,让用户能够验证信息的真实性。这一功能使得模型的回答具备高度的可信度,尤其适合农业科研、政策制定等对信息准确性要求极高的场景。
(四)高效的文献与数据处理能力
农业工作者常面临“海量资料难筛选、关键信息难提取”的问题,司农大语言模型针对这一需求,优化了文献与数据处理能力。对于农业学术论文、政策文件、行业报告等资料,模型能够快速提取核心信息、梳理逻辑框架、总结关键结论,大幅节省用户的资料整理时间。例如,用户上传一份关于“中国农业对外投资现状”的研究报告,模型可在短时间内提取投资规模、区域分布、企业类型等核心数据,并分析背后的行业趋势,无需用户逐字阅读整理。
(五)完全开源的轻量化部署优势
司农大语言模型提供8B和32B两种参数版本,其中8B参数版本具备轻量化部署的优势,可在普通服务器、甚至高性能工作站上运行,降低了用户的硬件部署成本。同时,模型采用完全开源的策略,用户可基于开源代码进行二次开发、模型微调,适配自身的个性化农业场景需求,例如针对地方特色作物种植、区域性病虫害防治等场景优化模型能力。

三、技术细节
司农大语言模型的技术核心围绕“高质量数据训练”和“多智能体检索增强(RAG)框架”两大方向构建,同时融合多种优化策略,解决通用大模型在农业领域的应用痛点,具体技术细节如下:
(一)大规模高质量农业数据集构建
模型的性能基础源于超40亿token的大规模农业领域数据,研发团队通过多渠道收集、筛选、清洗,构建了涵盖多类型、多领域的权威数据集,具体数据构成如下表所示:
| 数据类型 | 数量 | 涵盖内容 |
|---|---|---|
| 农业专业书籍 | 8,863册 | 动物科学、作物育种、园艺学、农业经济等全学科专业教材、专著 |
| 农业学术论文 | 243,897篇 | 国内外核心期刊发表的农业科研论文,涵盖基础研究、应用研究等方向 |
| 政策、标准、专利 | 196,748份 | 国家及地方农业政策、农业行业技术标准、农业领域发明专利文件 |
| 网络农业知识 | 海量 | 农业生产实操经验、田间管理技巧、农产品市场信息等 |
除了基础数据集,研发团队还构建了多样化的指令数据集用于模型微调,包括QA(基础问答)、COT-QA(思维链问答)、Incontext-QA(上下文参考问答)、Incontext-COT-QA(上下文参考+思维链问答)等类型。通过不同类型的指令训练,模型能够逐步掌握农业问题的解答逻辑,提升对专业知识的理解与生成能力。
(二)多智能体检索增强(RAG)框架
针对农业领域专业文献检索效率低、知识利用不充分的问题,司农大语言模型创新推出多智能体检索增强(RAG)框架,这是模型解决“幻觉问题”和“知识滞后性”的核心技术。该框架在传统RAG技术的基础上,通过优化知识库构建、智能查询改写、混合检索等策略,实现了农业知识的精准调用,其核心工作流程分为离线知识库构建和在线问答推理两个阶段:
离线知识库构建阶段
这一阶段是模型的“知识储备”过程,主要完成原始农业数据的处理与存储,为后续问答提供基础,具体步骤包括:文档加载:将不同格式的农业数据(PDF、Word、TXT、网页等)转换为统一的纯文本格式,去除页码、页眉页脚等无关格式信息,提取核心文本内容。
文档分割:将长文本拆分为200-500字符的短文本片段,既满足大模型的输入长度限制,又能保证每个片段的语义聚焦,提升后续检索的精准度。同时,保留每个片段的元数据,如文档名、页码、数据类型等,用于后续的答案溯源。
向量编码与存储:使用专业的文本嵌入模型,将分割后的文本片段转换为高维向量,这些向量能够捕捉文本的语义信息。随后,将向量与对应的文本片段、元数据一起存入向量数据库(如FAISS、Chroma),实现高效的相似性检索。
在线问答推理阶段
当用户提出问题时,模型通过这一阶段完成“检索-增强-生成”的全流程,输出准确的答案,具体步骤包括:问题向量编码:使用与知识库构建阶段相同的嵌入模型,将用户的问题转换为向量,确保编码规则一致,才能进行有效的相似性匹配。
智能查询改写与混合检索:这是多智能体框架的核心优化点,模型会先通过智能体对用户的原始问题进行改写,优化关键词与表达逻辑,再采用“关键词检索+语义相似性检索”的混合检索策略,从向量数据库中筛选出Top 3-5个最相关的文本片段,避免单一检索方式的局限性。
增强提示与生成:将“用户问题+检索到的参考片段+格式指令”整合为增强提示词,发送给大模型。格式指令会明确要求模型“严格依据参考资料回答,未提及内容需说明,同时标注答案来源”,最终模型基于增强提示词生成准确、可溯源的答案。
(三)模型训练与优化策略
在模型训练阶段,研发团队并未采用单一的训练方式,而是结合传统指令微调与多维训练数据,实现模型能力的全方位提升:
传统指令微调:基于农业领域的QA数据集,让模型学习基础的农业问题解答方式,掌握农业知识的基础关联逻辑。
思维链(COT)训练:通过COT-QA数据集,引导模型学习“一步一步分析问题、推导答案”的逻辑,提升模型的推理能力,避免简单的“关键词拼接式”回答。
上下文参考(Incontext)训练:利用Incontext-QA和Incontext-COT-QA数据集,让模型学会结合外部提供的上下文信息解答问题,增强模型对个性化、场景化农业问题的适配能力。
同时,针对模型的参数规模优化,研发团队分别训练了8B和32B两个版本:8B版本注重轻量化与部署便捷性,适合中小企业、科研团队的本地化部署;32B版本则追求更高的知识容量与推理性能,适合大型农业企业、科研机构的深度应用。
四、应用场景
司农大语言模型凭借其专业的农业知识储备、精准的回答能力和灵活的部署方式,可广泛应用于农业科研、农业教育、农业生产、农业管理四大核心场景,覆盖不同用户群体的需求,具体应用场景如下:
(一)农业科研场景
农业科研工作者是司农大语言模型的核心用户群体之一,模型可在文献调研、实验设计、数据分析、论文写作等环节提供支持:
快速文献检索与分析:科研人员可通过模型快速检索农业领域的相关学术论文,模型能提取论文的研究方法、实验结果、核心结论,还能对比分析多篇论文的研究差异,为科研选题提供参考。
实验方案设计建议:针对作物育种、病虫害防治等科研实验,模型可结合现有研究成果,为科研人员提供实验设计的思路,包括实验变量设置、样本选取方法、数据分析模型等。
科研论文辅助写作:模型可协助科研人员撰写论文的引言、讨论、结论等部分,优化论文的逻辑结构与学术表达,同时还能对论文中的专业术语、数据表述进行校对,提升论文写作效率。
(二)农业教育场景
在农业院校的教学与学习过程中,司农大语言模型可作为智能助教与学习助手,弥补传统教学的局限性:
课堂教学辅助:农业专业教师可利用模型制作教学课件、设计课堂提问、讲解复杂的农业专业知识,例如通过模型的思维链推理能力,向学生拆解“植物光合作用的调控机制”“畜禽疫病的传播路径”等难点内容。
个性化学习辅导:农业专业学生可通过模型进行课后答疑,针对课堂上未理解的知识点、作业中的难题向模型提问,模型能以通俗易懂的方式进行讲解,还能提供相关的学习资料推荐。
实践教学指导:针对农业实习、田间实践等环节,模型可提供实地操作的指导建议,例如向学生讲解“果树修剪的具体方法”“蔬菜大棚的温湿度调控技巧”等,帮助学生将理论知识与实践结合。
(三)农业生产场景
农业生产实践者(包括种植大户、养殖企业、农业合作社等)可利用模型解决生产中的实际问题,提升农业生产的效率与质量:
病虫害诊断与防治:当田间作物或畜禽出现异常症状时,用户可向模型描述症状特征,模型能结合农业知识进行病虫害诊断,并给出针对性的防治方法,包括农药/兽药的选择、使用剂量、施用时间等。
田间管理与养殖指导:模型可根据不同作物的生长周期、不同畜禽的生长阶段,提供个性化的田间管理和养殖指导,例如小麦的施肥时间与施肥量、生猪的饲料配比与养殖环境要求等。
农产品市场信息分析:模型能为用户提供农产品的市场价格走势、市场需求变化、销售渠道建议等信息,帮助用户做出合理的生产与销售决策,降低市场风险。
(四)农业管理场景
农业管理部门的工作人员可利用模型提升政策制定、行业监管、政务服务的效率:
农业政策研究与制定:模型可协助工作人员分析国内外的农业政策案例、梳理农业发展的现状与问题,为地方农业政策的制定提供数据支撑与决策参考。
农业行业数据统计与分析:模型能对农业生产、农产品市场、农业企业发展等数据进行整理与分析,生成可视化的数据分析报告,为农业行业监管提供依据。
农业政务服务咨询:模型可作为智能客服,为农民和农业企业解答农业补贴申请、农产品质量认证、农业项目申报等政务问题,提升政务服务的响应速度与服务质量。
五、使用方法
司农大语言模型采用开源开放的使用策略,用户可通过“模型下载部署”和“数据合作申请”两种方式使用,具体使用方法如下,操作流程通俗易懂,适合不同技术水平的用户:
(一)模型下载与部署
司农大语言模型1.0版本的8B和32B参数版本已在魔搭社区(ModelScope) 正式开源,用户可免费下载模型权重文件,并进行本地化部署或二次开发,具体步骤如下:
注册魔搭社区账号:访问魔搭社区官网,完成账号注册与实名认证(个人用户可直接注册,企业用户需进行企业认证)。
找到模型开源地址:在魔搭社区的搜索栏中输入“Sinong1.0-8B”或“Sinong1.0-32B”,进入对应的模型详情页面。
下载模型权重:在模型详情页面中,选择适合的下载方式(支持直接下载、通过Git克隆、使用ModelScope库调用),根据自身的硬件条件选择8B或32B版本:
8B版本:硬件要求较低,推荐使用配备NVIDIA RTX 3090/4090显卡(24G显存)或同等性能显卡的服务器/工作站,可满足基础的问答与分析需求。
32B版本:硬件要求较高,推荐使用配备NVIDIA A100显卡(40G/80G显存)或多卡集群的服务器,适合深度的二次开发与大规模的业务应用。
模型部署与调用:
基础部署:使用Python语言结合Transformers、PyTorch等深度学习框架,加载模型权重文件,即可实现简单的问答调用,模型详情页面提供了详细的部署代码示例,用户可直接参考运行。
二次开发:基于开源的模型代码,用户可根据自身的场景需求,加入自定义的农业数据集进行模型微调,优化模型在特定场景的性能,例如针对“茶叶种植”“水产养殖”等细分领域进行定制化开发。
(二)基础/过程数据申请
如果用户需要使用研发团队构建的超40亿token农业基础数据集,或模型训练的过程数据,可通过邮件方式向研发团队提出合作申请,具体要求如下:
申请邮箱:llm4cca@njau.edu.cn(南京农业大学司农模型研发团队专属邮箱)。
邮件内容要求:邮件需注明“司农模型数据合作申请”,并包含以下信息:
申请人信息:姓名/企业名称、联系电话、所属单位、研究/应用方向。
数据使用目的:详细说明数据的使用场景,如“农业科研项目研究”“农业企业产品开发”“农业院校教学研究”等。
数据使用范围:说明数据的使用规模、使用期限、是否用于商业用途等。
审核与反馈:研发团队会在收到邮件后的1-3个工作日内进行审核,审核通过后,会根据用户的需求提供相应的数据获取方式;若审核未通过,会说明具体原因并给出建议。
(三)使用注意事项
司农大语言模型的开源代码与模型权重仅可用于非商业或商业授权场景,未经研发团队许可,不得将模型用于违法违规、损害农业行业利益的场景。
模型部署过程中,需保证硬件设备的驱动、深度学习框架等环境配置符合要求,避免出现模型加载失败、运行卡顿等问题。
二次开发过程中,若使用自定义数据集,需保证数据的合法性与权威性,避免引入错误信息导致模型性能下降。

六、常见问题解答(FAQ)
问题1:下载模型权重时,出现下载速度慢、下载中断的情况怎么办?
解答:建议更换网络环境(如使用校园网、企业内网),或通过Git克隆的方式分批次下载;若仍出现问题,可发送邮件至研发团队邮箱,说明具体问题,团队会提供备用的下载链接。
问题2:本地硬件设备无法满足32B版本的部署要求,是否可以使用8B版本进行二次开发?
解答:可以。8B版本与32B版本的核心算法与知识储备一致,只是参数规模不同,8B版本完全支持二次开发,仅在复杂推理任务的性能上略低于32B版本,适合中小规模的定制化开发。
问题3:部署模型时,出现“显存不足”的提示,该如何解决?
解答:可通过以下两种方式优化:一是降低模型的推理精度(如将FP32改为FP16或INT8),减少显存占用;二是使用模型并行技术,将模型拆分到多张显卡上运行,适合多卡硬件环境。
问题4:模型回答农业问题时,标注的信息来源是否可以查看原始文档?
解答:模型标注的信息来源包含文档名、页码等元数据,若该文档属于公开可获取的资源(如公开的学术论文、政策文件),用户可通过网络检索获取原始文档;若属于研发团队的内部整理数据,可通过数据合作申请的方式获取。
问题5:模型是否支持多模态输入,比如上传农业作物的图片进行病虫害诊断?
解答:目前司农大语言模型1.0版本主要聚焦于文本类问答与分析,暂不支持图片、音频等多模态输入。研发团队会在后续的版本迭代中,逐步加入多模态功能,提升模型的应用能力。
问题6:模型的知识更新是否及时,能否获取最新的农业政策与科研成果?
解答:模型的基础训练数据截止到2025年底,对于2026年及以后的最新农业政策、科研成果,可通过多智能体检索增强框架的“在线知识库更新”功能,将最新的文本数据加入知识库,实现模型知识的实时更新。
问题7:企业用户申请农业基础数据集,是否需要支付费用?
解答:研发团队对非商业用途的数据集申请(如科研机构、农业院校的研究项目)实行免费政策;对商业用途的数据集申请(如农业企业的产品开发),会根据数据使用规模与场景,收取一定的技术服务费用,具体费用可通过邮件协商。
问题8:基于司农大语言模型进行二次开发后,开发的产品能否进行商业推广?
解答:可以。模型采用开源协议授权,用户基于模型进行二次开发的产品,可进行商业推广,但需在产品说明中注明“基于南京农业大学司农大语言模型(Sinong)开发”,并遵守开源协议的相关规定。
问题9:数据合作申请审核未通过,该如何修改申请内容?
解答:研发团队会在审核反馈中说明未通过的原因,常见原因包括“数据使用目的不明确”“所属单位与申请场景不符”等,用户可根据反馈意见修改邮件内容,重新发送至申请邮箱,团队会进行二次审核。
七、相关链接
GitHub开源仓库:https://github.com/njauzzx/Sinong
魔搭社区模型开源地址:https://modelscope.cn/organization/NAULLM
南京农业大学官网:https://www.njau.edu.cn/
八、总结
司农大语言模型(Sinong)是南京农业大学联合南京理工大学研发的国内首个通用农业领域开源垂直大语言模型,依托超40亿token的大规模农业高质量数据集构建,通过多智能体检索增强(RAG)框架和思维链、上下文参考等多维训练方式,有效解决了通用大模型在农业领域的“幻觉问题”和知识滞后性,具备农业知识全覆盖、分析推理智能化、回答输出高可信、部署使用轻量化等核心优势;模型提供8B和32B两种参数版本并在魔搭社区开源,用户可免费下载部署并进行二次开发,也可通过邮件申请农业基础数据集,使用门槛低、适配性强;其应用场景覆盖农业科研、教育、生产、管理四大核心领域,能够为不同用户群体提供专业的农业知识支持与决策参考,同时开源开放的策略也为智慧农业的发展培育了良好的技术生态,为我国农业现代化与数智化转型提供了重要的技术支撑。
版权及免责申明:本文由@AI铺子原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/sinong-llm.html

