您好,欢迎来到锐游网。
搜索
您的当前位置:首页基于可视化的时空数据挖掘研究与应用

基于可视化的时空数据挖掘研究与应用

来源:锐游网
安徽农业科学.JournalofAnhniAgn.Sei.2012。柏f17):9542—9545责任编辑姜丽责任校对卢瑶基于可视化的时空数据挖掘研究与应用陈霞,陈桂芬+(吉林农业大学信息技术学院,吉林长春130l18)摘要在研究可视化与空间数据挖掘关系的基础上,探讨了可视化在时空数据挖掘过程中的应用。利用可视化表现形式使历年来测量到的玉米产量数据和精准施肥数据充分地结合在一起,同时使人们更加直观、清晰地比较和分析玉米产量和精准施肥二者之间的关系。系统地分析精准施肥对玉米产量的影响.展现了多年来精准施肥的成果.作到修正现有的精准施肥策略、指导来年的精准施肥策略.从而使得玉米增产并且更加精准地预测玉米产量。关键词可视化;时空数据挖掘;空间变异图;加权模糊聚类算法中图分类号S127文献标识码A文章编号0517—66ll(2012)17—09542—04StudyandApplicationofVisualizationinSlmUo-temporalDataMlll;l唱CHENXia(CollegeofInformationTechnology,JilinAS-culturalUniversity,Changchun,Jilin130118)AbstractBasedontherelationshipsbetweenvisualizationandspatio-temporaldatamining,theapplicationofvisualizationinthedataminingprocesswasspatio-temporaltodiscussed.Thevisualizedexpressionofmaizeyielddataandprecisionfertilizationdataenablepeopledirecflyandclearlycompareandanalyzetheirrelationships.TheeffectsofprecisionIjrtihzationOnmaizeyieldwereanalyzed.theachievementsofyearsofprecisionfertilizationwerepresented,thepresentprecisionfertilizationstrategieswelyerevisedtoguidethefertilizationofnexlyear,80∞toim—provethemaizeyieldandpreciselypredictthemaizeproduction,KeywordsVisualization;Spatio—temporaldatamining;Spacemutationfigure;Weightedfuzzyclusteringalgorithm时空数据挖掘的结果既然是时空对象的时空知识、时空规则、时空规律,那么就必须用可视化的手段加以表现,使挖掘出的时空知识具备直观、形象的特点。其实现形式可以是利用GIS的多种表现手段,也可以是用其他的可视化手段。时空数据挖掘可视化的目标是将挖掘出来的晦涩的规则转化成易于理解、易于识别的3维网形和符号化表达方式,并通过Web方式实现远程访问,支持多用户同时交互浏览。这需要根据多种不同的时间和空间尺度、不同的观察角度、不同部分的选择与聚集等多维综合探索与处理来揭示出空间数据中所隐含的内在联系与发展演化规律…。为此,笔者从这个角度人手,利用基于可视化的时空数据挖掘,对不同精准施肥下玉米产量的动态变化规律作以分析。探讨产量、土壤肥力的空间变异规律,旨在为揭示精准施肥对玉米产量形成的影响提供资料,并为高产施肥提供理论依据忙j。1技术方法1.1可视化时空数据挖掘基本概念可视化时空数据挖掘是指采用可视化的方式去检查、理解、交互时空数据挖掘算法,利用可视化技术把源数据或者挖掘结果以直观的形式展示出来,并通过人的视觉系统进行调节。时空数据挖掘是指从大量具有时间、空间属性的数据中抽取出潜在的、有价值的知识的过程,它也是与机器学习、人工智能、统计学习、神经网络和计算机科学有交叉领域的学科。可视化就是把数据、信息和知识转化为可视的表示形式的过程”j。可视化技术不仅可以用来显示高维的数据,还可以指导数据检索过程。可视化数据挖掘的目的是使用户能够交互地浏览数据和挖掘过程,还可以对训练后得到的结果模型进行直观的调整。使用有效的可视化时空数据挖掘技术,可以利用用户丰作者简介陈霞(1986一),女,吉林长春人,硕士研究生,研究方向:计算机农业应用。E-mail:420269715@qq.corn。・通讯作者,教授,博士生导师,从事专家系统、数据挖掘、精准农业研究.E・mail:guifchen@163.eom。收稿日期2012-03-09富的领域知识来规整、约束挖掘过程,改善挖掘结果,使用户参与到决策分析的过程巾H1。可视化时空数据挖掘技术在数据分析和大型数据库搜索上有很高的应用价值,特别是在对数据不了解、探索目标不确定的情况下,可视化时空数据挖掘技术将会更有效。可视化时空数据挖掘也是数据库中知识发现过程中的步骤,它帮助用户从数据库或数据仓库中发现未知的、潜在的和有使用价值的信息的方法、理论和技术。可视化技术主要包括数据、模型和过程三方面的可视化“。1.2可视化技术在时空数据挖掘中的应用可视化时空数据挖掘就是用数据或知识可视化技术从大数据集中发现隐含的有用的知识,可看作是由信息可视化和时空数据挖掘两个学科融合而成。如图1所示,可视化技术同数据挖掘主要从以下几个方面相结合,形成可视化时空数据挖掘。蓁蓁霎圈1可视化技术在时空数据挖掘中的应用1.2.1数据可视化。在进行数据挖掘算法之前,将数据库或者数据仓库中的数据,从不同粒度和不同抽象层次或将属性、维度进行联合之后,把数据表转换为可视化结构,并以各种不同类型的形式展现在用户的面前HJ。1.2.2数据挖掘结果可视化。将挖掘后得到的知识或者结果用可视化的形式表示出来,使原本抽象的挖掘结果信息简明化,加速人们对结果信息的特征、关系、模式和趋势等的理解,从而对挖掘结果的正确性作出判断,得出科学的挖掘结万方数据40豢17期陈霞等基于可视化的时空数据挖掘研究与应用9543果。用户可以根据结果信息,迭代地调整算法的参数,使得挖掘结果更符合人们的需求。1.2.3数据挖掘过程可视化。这种方法将可视化技术融入到数据挖掘过程中,在交互式的可视化数据挖掘中使用可视化工具,用户可以通过设置参数来控制整个挖掘过程的进度和质量,并且依靠感觉、具备的领域知识以及挖掘算法的结果作出决策,是最理想的可视化数据挖掘过程M1。1.3时空数据挖掘可视化的过程1.3.1时空数据准备阶段。时空数据准备包括时空数据选取和时空数据预处理。时空数据选取的目的是确定发现任务的操作对象,根据用户需求抽取一定时间范围内的空间数据。集成存储。时空数据预处理一般包括消除噪声、推导计算缺省数据、消除重复记录、完成数据类型转换等。1.3.2时空数据挖掘阶段。首先要明确挖掘的任务和目的,如时空数据特征化、时空分类、时空聚类、时空关联规则或时空预测等;然后决定使用什么样的挖掘算法,采取什么样的挖掘策略,算法和策略的选择要根据具体应用以满足用户需求为原则,兼顾大数据集上的复杂计算。1.3.3结果的解释评估阶段。该阶段对时空数据挖掘发现的模式进行评估,剔除冗余或无关的模式。如果模式不满足用户需求,则整个发现过程要退回到发现阶段之前,通过重新选择数据、采用新的数据变换方法、或者是换一种挖掘算法等重新进行数据挖掘,同时使用可视化和知识表达技术,向用户提供挖掘的知识。这一阶段通常借助GIS软件进行前端展示,充分体现时空数据的形象、生动、直观等特点”j。田3采样网格示意2.3空间模糊聚类挖掘算法空问模糊聚类分析的主要步骤为空间信息的实时采集、空间数据预处理、定义空间离散点的距离函数、设定并衡量空间数据点之间的相似度和隶属度、模糊聚类分析和聚类结果输出与评估,如图4所示。缈翁够霰空阿:广1:}.==蛰匿::jW一两豫…1i广—1广—1:;i-.。弱暮墨…j麟圈2时空数据挖掘过程糊|圈4空间模糊曩类藏程2试验验证2.1研究区域试验地点为国家“863”示范区吉林省榆树市弓棚镇十三号村3号地,位于吉林省东部、榆树市西北部,距市区26km,地理位置126.315738。一126.31744.999017。E、空间聚类挖掘算法是是基于对客观实体的空间分布结构特征考量的一种聚类方法。空问数据挖掘首先要考虑到空间实体之间的相互关系。但传统的聚类分析方法往往忽略了空间关系对于聚类分析结果的影响。该研究采用的空间聚类挖掘算法是将空间实体作为一个群体来考察分析,着重考虑空间实体问的关系对于挖掘结果的影响。空间实体之间的拓扑关系,如邻接、相交、距离等等关系在聚类模式的选择上起了很大的关键作用。该研究将这些因素纳入考量的因素之中是与传统的聚类分析最显著的差别之一iI…。3结果与分析3.1空间变异分析以2008年为例.将吉林省榆树市弓棚859—45.00276l。N;属半湿润中温带季风气候区。其特点是四季分明,冬长夏短,年平均气温4.6—5.6℃,无霜期135d左右,年均降水量500—700nlrfl。试验田总面积约为25hm2。土壤类型属典型的黑土,主要作物是玉米和大豆等,它是吉林省重要的商品粮基地之一。2.2数据获取该研究中,连续多年利用GPS、GIS、RS技术进行了试验地玉米农田信息的获取。利用DGPS将地块划分成40111x40m的网格单元,Al—L10为采样点,如图3所镇玉米产量数据和土壤中的速效磷数据的属性信息转化为空间信息,然后选用Kriging插值方法计算出区域内玉米产量和土壤速效磷二维空间变异图,如图5、6所示。示。在此网格单元内取样,取样深度为25cm,取样方法为5点梅花采样法,即将网格4个角上和网格中心点上的土样进万方数据9544坼搿农业科学2012年●\图5异图的显示,有利于土壤肥力分析和评价,还可将土壤肥力空间变异图进行任意的平移、旋转、剖分和抽取等值面等操作。有利于挖掘出隐藏在数据后面的规律。3.2可视化时空数据挖掘结果根据各网格的空间位置关18mmm~8m%lN58缸陆l舶一9盥2"%9盟坤q7—9巍6Ⅺ蛳9暾6蕙,7—1021k强7510mL强%一107珏4bⅡlO强4b№-U强硒弱一U理觚抽~UMm%llMl91%一口强鼬≈控26&勋Ⅺ一U阻蛐"系,对土壤有机质、速效氮、速效磷和速效钾4种养分数据进行空间模糊聚类分析”””1。将模糊相似度为0.992、A=0.986时的聚类结果与GIS结合进行分析,用可视化手段表现出来,如图7所示2111)8年产量空间变异图卧翻m研一H嘲嘲uH孵4吟316~拉拉34135lm出413女一五投强"扛垃m∞一丑鼬嘟凹皿强烈日一五5l【捕镕强5Il矾∞一m啪694w蚰郴批%一黾行0吣砷虹”0∞m—m聃强bm鲫335∞一鱼瞄鼬9【图72008年玉米田间土壤养分空间模糊聚类结果3.3人机交互界面分析图8中曲线即为3号地中土壤中氮、磷、钾和产量之间的关系图。这表明可以根据多年来的图620惦年速效磷空间变异图历史数据对土壤养分空间的历史演变进行总结,并为对变量施肥过程与增产结果的校验和预测提供了一个客观、形象、可靠的辅助决策工具。历年来3号地的总产量和平均产量都有所提高,但是各玉米产量空间变异图(图5)相比玉米产量曲线图所能表现的信息量更多,对于玉米产量的空间变化的显示更清晰、直观和真实。可视化技术不但可应用于土壤肥力空间变图8aO略年产量与土壤肥力关系可视化查询个样点之间的差异性还是很大,NN土壤本身的肥力有关,"gN许多的外在因素有关。通过可视化技术可以指导人们在精准农业方面更加精细。4结论时空数据可视化挖掘的研究和应用才刚刚兴起,理论和技术都处在探索阶段,出于不同的专业方向在认识上也存在着差异。该研究提到的时空数据可视化方法把知识发现、数据挖掘与地图学、GIS等技术紧密地联系在一起,特别是面对地理空间数据,它的开发与挖掘都离不开人的空间思维的参与;利用GIS和一些相关技术收集来的历年玉米产量、土壤万方数据40卷17期陈霞等基于可视化的时空数据挖掘研究与应用9545肥力数据,进行空间分析和制定决策,可更形象、直观、准确2009地展现出不同年份玉米的产量趋势,比较同一地区使用不同[6]工静.可视化技术在数据挖掘中的研究与应用[D].长春:吉林大学,2009.施肥策略的结果等。总之。基于可视化的时空数据挖掘是一[7]捌垒.数据挖掘可视化模型及其应用研究[D].北京:北京交通大学,个实用价值非常大的领域,值得作更加深入的研究。2009.[8]f合龙.陈桂芬,毕春光.玉米精准施肥数据库建模研究[J].玉米科参考文献学。20【]8.16(4):184一l鼹.[1]毕硕本,耿焕同.阗国年.围内卒司数据挖掘研究进展与技术体系探讨[9]赵月玲,陈杜芬,工越荩于GIS的土壤养分空间变异状况研究[J].西lJ]地理信息世界.2【)08{1):2l一船.北农业学报,2f105,14(6):195—198[2]战秀梅,韩魂口,杨劲峰,等不同氮、磷、钾肥用量对玉米源库干物质[10]陈桂芬,曹Hi英,王国伟加权空间模糊动态聚类算法在土壤肥力评积累动态变化的影响[J]._丁壤通报,2007.38(3):495—499.价中的应用[J。.中囤撼Jt科学,2009(10):3359—3563.[3]NADG.InformationVisualization[J].IEEEconkouter0讪jcsendAp-[11]陈桂芬.面向精准农业的空间数漏挖掘技爪研究与应厢[D].长春:吉plicatiorts。1997.8:29—31.林大学。2009.[4]_蘸血岩,刘光远。苑森巅.可视化数据挖掘技术[J].吉林大学学报:信[12】姜建.基j+空问模糊聚类的可视化变鲋把决策系统[D],长春:吉林[5]罗建.aJ视化黼挖掘方法的研究与实现[DJ成都:电子科技大学,息科学版,20136(6):567-571.农业大学,2011.(上接第9538页)的、能够全面检查计算机与网络系统的计算机取证的T具与的商业道德,其行为亦构成了不正当竞争。对于注册的域软件已经迫在眉睫。名,主要看其是否在为商品宣传所用,是否闲置,反之视为域同时,手机用户在农村有广阔的应用空间,如果充分发名抢注‘“。挥移动电子商务的优势,充分整合农业信息资源,建立高效3电子商务法律体系下的隐私权保护的移动网络平台,在未来几年.农业电子商务在农业中会逐隐私权是指公民享有的私人生活安宁与私人信息依法渐广泛应用。移动电子商务在农业中的普遍应用,使很多农受到保护,不被他人非法侵犯、知悉、搜集、利用和公开的一业电子商务主体者都在使用手机进行支付交易,所以最需建种人格权,是公民个人享有的一种人格权。我国隐私权保护立统一网络支付体系。符合农业电子商务的支付方式就是的法律基础《宪法》、《民法通则》、《计算机信息网络国际联手机支付。但现有的支付工具繁多,不利于支付信用的共享网安全保护管理办法》等法规均有提及。近几年.“人肉搜和监督。实现网上支付必须要建立一个全国统一的网上支索”成为网络环境下侵犯隐私权的最主要渠道。根据调查统付清算体系Ⅲ。计,我国网民总数是世界第一,而这个群体中农业参与者虽5结语’然少,但也呈现增长的趋势.且潜在的农民上网朋友庞大,如农业电子商务作为网络时代的一种全新的交易模式,相此庞大的群体,容易成为隐私权被侵犯的对象。管理不规对于传统交易方式是一场革命。建立健会农业电子商务的范。不以法律手段进行引导,将会发现很严重的社会问题。法律法规体系:一是要加强电子商务法律法规的研究。充分尤其农业交易中的个人信息包括姓名、电话等,最容易被侵借鉴在信息立法以及其他的一些体制和做法比较完善的国犯,参与网络交易,而莫名收到骚扰广告、短信的现象在农业家的经验,逐步建立起适应我国国情的农业电子商务发展方电子商务中比比皆是。要保护人肉搜索中的隐私权,必须具面的法律法规,用法律的制度来规范和保障农业电子商务的体问题具体分析,对人肉搜索中的隐私权应当采取直接保护健康发展。二是要加强市场的监督管理。要加强农村电子的模式,也就是立法,只有这样,才能从真正意义上保护人肉商务市场的监管,规范市场秩序,同时加强信用环境的建设,搜索中的隐私权一J。以保证网上正规渠道技术、产品、市场信息的可靠性,以形成良好的网上市场环境。尽管农村电子商务的发展条件日臻农村电子商务交易中的安全主要分为网络安全和信用成熟,但建立和完善农村电子商务不是一朝一夕能完成的工程,任重而道远,仍需要各方面共同努力。参考文献[I]樊鹂.对农村电子商务的几点思考[J].农业网络信息,2007(9):123一lM[2]中国互联网信息中心.2009年中国农村互联网发展状况调查报告[ER/OL].(2010—04)hltp://wⅥw.docin.conv'p56(:02124.html.[3]张戆l河北省农村电子商务发展现状与对策研究【J].商场现代化。2009(4):147—148.[4]干,j每毫.我国农村电-y.商-务发展现状及对策[J].经济导刊,2009(12):68—69.[5]郭军明.我围农村电子商务发展筑略浅x,tff[J].安徽农业科学,2009,37(拼):11772一11773.11780.[6】叶福泉.关于发展农村电子商务的思考[J].黎明职业大学学报.2006(1):19—21.[7]中围电子商务研究中心,农业电子商务发展的现状与对策研究[EB/OL].attp://ww'w.100ee.on/detail-5288807.html.万方数据4电子商务法律下和农业相关的其他法锋安全。电子支付手段不成熟,信用机制和约束机制也正处在探索阶段,给农民网上从事经贸活动带来很大影响。首先需要相应的计算机取证法律出台,在现有条件下,交易主体至少应该了解电子证据的相关法律。我同的计算机普及与应用起步较晚,有关计算机取证的研究与实践工作也仅有lO年的历史,相关的法律法规仍很不完善,学界对计算机犯罪的研究也主要集中于计算机犯罪的特点、预防对策及其给人类带来的影响16。。目前法庭案例中出现的计算机证据都比较简单,多是文档、电子邮件、程序源代码等不需特殊工具就可以取得的信息。但随着技术的进步,计算机犯罪的水平也在不断提高,目前的计算机取证技术已不能满足打击计算机犯罪、保护网络与信息安全的要求,自主开发适合我国国情基于可视化的时空数据挖掘研究与应用

作者:作者单位:刊名:英文刊名:年,卷(期):

陈霞, 陈桂芬

吉林农业大学信息技术学院,吉林长春,130118安徽农业科学

Journal of Anhui Agricultural Sciences2012,40(17)

本文链接:http://d.g.wanfangdata.com.cn/Periodical_ahnykx201217127.aspx

因篇幅问题不能全部显示,请点此查看更多更全内容

Top