大数据与现代农业(温孚江)
[ 摘要]大数据与农业结合成为行业热点,温孚江校长带领的大数据产业技术联盟为此做了很多工作。
大数据与现代农业
温孚江(山东农业大学校长 全国人大常委)
农汇网评:大数据与农业结合成为行业热点,温孚江校长带领的农业大数据产业技术联盟为此做了很多工作。农汇网总裁张志成有幸和温校长参与发起中关村大数据产业联盟给农业专委会,深感温校长敏锐的视野、严谨的治学,特别是对互联网的深刻理解和对年轻人的提携。临近春节,温校长在微信群中分享了本研究成果简稿,为让更多人了解农业大数据,经温校长许可,特选定年初一首发此文。后续还会发相关专题文章,期望有更多人投入农业大数据的研究。
何为大数据?这个概念好像还没有一个各方都能接受的定义。实际上也很难有一个十全十美的定义。像什么是“文化”一样,人类用了几千年了,至今尚无一个大家都能接受的关于什么是文化的定义。但这并没有影响文化的传承、传播、使用和发展。大数据的出现是基于互联网和云计算的高度发展而出现的一种新的数据获取、处理、存储、融合、计算以及分析的一种方法。高度发达的互联网和云计算的出现改变了人们的思维模式和生活方式,因此也改变了我们传统对数据的思维模式和处理方法,这就是大数据基本含义。
我国正在处于有传统农业向现代农业转变的转型期。现代农业至少包括五个特征。一是规模化,这是首要。没有规模化经营,就不可能走出小农经济的阴影,就谈不上效益和质量。二是机械化。机械化是规模化的前提,是提高效益,保证质量以及提高生产力的需要。这里所谈的机械化的要求是比较高的,一般只高度智能化的机械化。三是标准化。标准化是保障农业生产农产品和涉农产品质量、生态保护、食品安全和品牌化的需要。四是信息化。一方面,农产品及涉农产品的供需双方在各个环节具备尽可能相同的市场信息,另一方面,高度信息化和数字化,特别是大数据将被应用到每一个领域。五是市场化。按照市场的性质,市场大致可分为“场内市场”和“场外市场”。场内市场是一种相对规范的期货市场平台,主要指农产品和涉农商品的期货商品交易。这种交易因具有平台(交易所)规避风险和寻找价格的功能而备受发达国家的青睐和高效使用。显然,我国在方面还有很长路要走。我国现行的农产品和涉农产品的交易大量的是场外交易,这种交易存在行为不规范和交易风险的弊端,缺少权威的、并具有信用约束功能的供需信息平台,因而农产品价格的波动时有发生,对国家的粮食安全和食品安全带来不利影响。
分析可发现,现代化农业的这五个特征都离不开大数据的参与。农业大数据可助推农业现代化的实现。读者会问,何为农业大数据?笔者认为,农业大数据即是利用大数据的思维、方法以及技术来解决农业以及涉农行业的具体和宏观问题的云计算技术。农业大数据如何在农业现代化进程中起作用呢?农业大数据可服务农业的每一个环节,每一个领域。例如粮食安全问题,食品安全问题,现代育种及良种推广,土壤信息的变化与改良,生态农业的设计与发展,涉农产品市场监控及价格的预警,病虫害的预测、畜牧养殖业疫情的监控及预警预测,等等。归纳起来,农业大数据主要在三方面会发挥战略作用。一是指导生产:为农业(广义农业)生产的产前、产中、产后提供全程服务。 二是服务决策:为政府决策提供参考、咨询和指导服务, 为企业生产、转型、市场营销提供咨询、指导。三是预测未来。农业数据的来源即依赖互联网,但主要的数据还是在农业生产和经营中原创产生。这是农业大数据的一大特点。农业大数据的另一个特点是其“准公益性”。每一个数据都来之不易,值得加倍珍惜。
少说多干!在干中学习,在干中完善。这一直是我干事的基本信念。山东农业大学“农业大数据研究中心”和“农业大数据产业技术联盟”就是在这种理念下于2013年5月成立。
在农业大数据联盟成立后的一年多的时间里,我们只对国家战略和生产的需要做了一些研究。下面讲五个案例。
案例一,渤海粮仓增产增效的大数据支撑研究。
环渤海有5000万亩的盐碱地。其中4000万亩中低产田待提升,1000万亩盐碱地待开发。“渤海粮仓”科技示范工程将实现粮食单产每亩提高100-150公斤。该工程将集成不同程度盐碱地改良利用和粮、棉增产栽培技术体系5-7套,在山东环渤海地区30个县(市、区)推广应用1500万亩粮田,棉田改粮田100万亩,整治盐碱地20万亩,粮食增产30亿斤。为实现上目标,我们农业大数据研究人员参与到研发团队中。数据的挖掘我们采用了人工采集和物联网采集两个方案并用。
1、土壤差异的数据采集
我们选择有代表性的3万亩地分成在27个功能区,当地的科技人员按指定的采样标准采集土样。科技人员在土样上标记好经度、纬度、海拔、和相关基本的土壤和灌溉条件,通过邮寄方式将土样送达山东农业大学,利用相关仪器设备测量土壤的差异。至少测量如下指标:PH、盐、氮、磷、钾、有机质。土壤数据采集两次。
2、作物与生长差异的数据采集
在27个功能区,当地的科技人员在主要的生长期(冬苗期、拔节期、开花期、和成熟期),根据指定的标准来填写作物和苗情的情况。通过简易的网页填写,将数据上传至大数据中心。
3、气候差异的数据采集
开发数据采集软件,在中国天气网等网站查询和记录相关气象数据,同时我们研发了有自主知识产权的“神农物联网”设备,进行实时数据采集。
4、种植与生产差异的数据采集
在27个示范点,当地的科技人员记录种植类型 -“小麦-玉米或棉花改小麦”、灌溉类型 -“充足的黄河水灌溉或不充足的黄河水灌溉”、播期差异、施肥差异等数据,并按要求的标准上报。
5、病虫灾害差异的数据采集
在27个示范点,当地的科技人员记录病虫灾害的数据。有必要时,可以直接采用当地植保站的数据。
6、科技人员的数据采集标准与培训机制
以“当地人做当地事”为原则。科技人员之间,以及与大数据中心的通信与数据传输,通过专门的数据采集网站进行。
基于大数据挖掘模型的初步分析带来了跨领域整合数据的突破性成果。初步论证对苗情有重要影响的共有7类指标:区域(地理、气象等)、酸碱度、含盐量、播期、土壤墒情、种子品种、土壤养分(有机质、氮、磷、钾含量)等。因此,在如何促进苗情管理及后续产量提升问题上,应优先关注这些重要的影响指标,逐渐实现科学种田。
土壤改良意见。18%的土样有机质含量低,这些地块应加大有机肥的施用。东5功能区需要注意及时补施氮肥,以满足作物生长需要。 42%的样品有效磷含量偏低,不能满足生产需要,应及时补充。 另外,按照山东省滨海盐渍土分级标准,85%的土样属于脱盐地,但76个样点(22800亩)含盐量高,土壤改良难度大,成本高,不太适合种粮。特别是其中的2400亩重度盐碱地,应改为其他使用方式使之产生效益。 在测定的样点土壤中已有27.50%出现干旱,需要灌溉。
春季麦田管理意见。根据一类苗数占所有采集点8.2%、二类苗占12.4%、三类苗占79.8%及无病虫和冻害等数据信息,建议加强分类指导,因地因苗制宜,科学运筹肥水,抗旱保苗,促弱转壮,控盐保墒,构建合理群体,加快转化升级,奠定丰收基础。
案例二,基于大数据的奶牛数字化精细养殖系统的研发。
传统的奶牛养殖方式不适合规模化养殖。我们用大数据的思维设计开发数字化精细奶牛养殖管理系统。通过对历史和实时数据的采集分析,构建数据库,模型的构建等,实现奶牛精细养殖的自动控制。通过大数据研究,提高奶牛饲料营养、育种、繁殖、疾病防治等技术管理水平。
对奶牛产奶量、运动量、体重变化、乳汁电导率、牛舍温湿度等数据进行实时采集和贮存管理,通过对实时数据的监控和模型分析,并结合对历史数据的分析建立模型,监控奶牛产奶量是否异常,对奶牛发情、乳房健康状况进行诊断。同时设计研制了一些配套设备,如计步器,RIFD数据读取设备,产奶量计量器,挤奶厅控制面板,自动称重和自动分群系统,自动补料系统,牛舍环境自动控制系统等。本系统研制成功后在几个奶牛场进行了实验,通过了实用考验,已经具备推广和商业化的条件。这套系统的主要功能包括:
1)自动补料。通过产奶量、运动量、体重适时记录数据,系统分析给出奶牛个体营养需要量,在挤奶厅对每一头奶牛进行定量补饲,实现奶牛的精准营养管理。
2)自动发情诊断。记录奶牛适时运动量,通过与由历史数据建立的发情诊断模型比对,发现发情牛只,检出率>90%,误检率可<3%,较人工发情诊断检出率高1倍以上,基本不需直肠诊断发情。
3)辅助疾病诊断。通过产奶量、乳汁电导率、体重、运动量等实施数据监控分析,及时发现疑似病牛(乳房炎),单独分群后做进一步诊断、治疗。
4)自动分群。在挤奶厅出口设置分群门,自动识别牛号,通过软件设置分群参数控制分群门开闭,将发情、疑似病牛等从牛群中单独分离出来。
5)自动环境控制。通过对适时监控的牛舍温湿度数据进行分析,自动控制风机、喷淋设备,实现牛舍自动控制降温,缓解夏季奶牛热应激。
案例三,生物数据库的构建与应用。
山东农业大学生物数据库是利用生物性状,生物照片,生物基因组、表达组、代谢组、甲基化、基因芯片序列等数据,借助生物信息学和大数据的方法,通过数据分析与整理,构建面向所有科研工作者完全开放的系列实用生物数据库平台(http://biodb.sdau.edu.cn/database/)。目前,本数据库中包含原始生物数据3T(约3000G),有植物、动物、微生物等200多个物种信息,并构建了植物内含子多态性与微卫星联合标记数据库、烟草遗传育种数据库、水稻白叶枯与细条病全基因组关联标记数据库、禾本科微卫星数据库、烟草单核苷酸多态性数据库、植物选择性剪切位点数据库、小麦寄主与病原互作数据库、烟草寄主与病原互作数据库、单核苷酸多态性分析数据库等多个专业子数据库平台。随着现代生物和信息技术的发展,生物数据也成指数型增长,本数据库平台将会实时更新和补充,为我国生物研究和植物遗传育种提供精准有力的数据支持。
基于这些专业数据库,已经初步定位和克隆了一些与高产、优质、高抗等主要农艺性状相关的基因;构建了快速鉴定田间病害的试剂盒;利用数据库中的分;子标记,筛选了大量种质资源,为种质资源的调查、收集、分类、保存和育种利用提供了物质基础和技术支持。
案例四,某国家级高新区科技投入贡献分析
首先,我们该高新区的配合下,对高新区进行了数据挖掘、处理和建模。这些数据包括区内各个企业生产经营的相关数据,税务数据,工商数据,海关数据,银行相关数据,财政数据,等等。建立数据库后,对数据进行相关性研究,构建模型。通过研究,获得以下数据成果:“高新区经济发展及产业研究数据库”一套;“高新区经济发展及产业数据库”元数据管理规范一套。 形成报告成果:《山东高新区元数据规范》、《山东高新区数据转换规则》、《基于大数据的科技投入贡献分析研究报告》。同时形成一套平台成果:《高新区决策分析平台》,供政府和企业决定使用。
这一研究对高新区的转型发展具有很强的实用价值:形成了高新区数据整合机制,为相关其它分析研究提供数据支撑;对同一产业各企业的科技投入适宜度分析,供高新区管委会和各企业对后续科技投入提供决策参考;据此可对区内企业进行综合评价,帮助企业发现影响企业发展的重要指标在产业中的位次,为企业经营管理提供参考。
案例五,山东省二代玉米螟发生程度 预测模型的构建。
二代玉米螟是危害北方玉米的主要害虫,严重影响产量和质量。研究表明,它的发生、流行受多种因子影响,其中气候因素影响最大。我们选定泰安、临沂、济宁、烟台和滨州代表山东省5个不同的玉米种植生态区,进行玉米螟发生程度和气象因子的历史数据挖掘和研究。研究表明,利用历史数据确定玉米螟发生程度与9种气象因子的关联度,确定其中2个关联度最强的作为计算用因子。
用大数据技术模拟“预测”玉米螟的发生程度(拟合值),再与玉米螟历上实际发生程度对比。研究发现,6月下旬、7月上旬、7月下旬和8月上旬模型拟合值的准确率分别为91%、77%、69%、和68%。短期预测准确率高于以往同类预测,为我们下一步深入研究奠定了基础。
本研究为初步研究,因为数据的粒度和广度有限,而且影响玉米螟发生的其他可能因子尚缺乏数据支持,有待下一步加强。
以上是我们农业大数据技术产业联盟在不到两年时间里的一些初步研究成果。下一步我们将紧紧围绕农业现代化的需求,组织好我们的联盟单位共努力。目前,我们正在扩展和深化农业大数据的研究,包括宏观的和微观的研究,这些研究都是问题导向型的,接地气的,为解决三农问题和农业现代化做出我们实实在在的贡献。