新聞中心
什么是GIS技術?
GIS是英文Geographic Information Systems的縮寫,中文習慣譯為地理信息系統(tǒng)。通常泛指用于獲取、存儲、查詢、綜合、處理、分析和顯示地理空間數(shù)據(jù)及與其相關之信息的計算機系統(tǒng)。它是隨著計算機技術和地理科學等的發(fā)展而發(fā)展起來的,它通過計算機對各種地理空間數(shù)據(jù)進行組織、管理、統(tǒng)計、分析和顯示,生成并輸出用戶所需要的各種地理信息,它由計算機、地理信息系統(tǒng)軟件、空間數(shù)據(jù)庫、分析應用模型和圖形用戶界面及系統(tǒng)管理人員所組成。
創(chuàng)新互聯(lián)建站服務項目包括襄垣網(wǎng)站建設、襄垣網(wǎng)站制作、襄垣網(wǎng)頁制作以及襄垣網(wǎng)絡營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關系等,向廣大中小型企業(yè)、政府機構等提供互聯(lián)網(wǎng)行業(yè)的解決方案,襄垣網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務的客戶以成都為中心已經(jīng)輻射到襄垣省份的部分城市,未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任!
自從20世紀60年代初GIS概念在加拿大提出以來,隨著多學科、多技術的發(fā)展和密切結合,尤其是計算機技術和空間分析理論的飛速發(fā)展,GIS的含義和應用在不斷擴大,GIS技術在最近20多年內(nèi)取得了驚人的發(fā)展,并廣泛地應用于各個領域。例如,土地信息系統(tǒng)可看成是GIS技術在土地管理的具體應用,因此,GIS技術是土地信息系統(tǒng)建設最為關鍵的技術之一。
目前,GIS技術的幾個發(fā)展主要表現(xiàn)在:
(1)三維GIS和時態(tài)GIS的發(fā)展已取得了一定進展。
(2)GIS和GPS、RS三者結合的技術日益成熟。
(3)空間數(shù)據(jù)的存儲管理技術發(fā)展迅速。
隨著對象—關系數(shù)據(jù)庫技術的發(fā)展,將空間數(shù)據(jù)無縫集成在DBMS中已成為現(xiàn)實。關系數(shù)據(jù)庫(RDBMS)和GIS的結合,利用RDBMS存儲GIS數(shù)據(jù),并通過RDBMS存取和操縱這些數(shù)據(jù)。新的RDBMS(如ORACLE產(chǎn)品)支持新的對象—關系模型,從而可以更好地支持空間數(shù)據(jù)類型(4)組件GIS技術。地理信息系統(tǒng)的組件化,就是采用組件(Component)技術實現(xiàn)地理信息系統(tǒng)基礎平臺和應用系統(tǒng)。其本質(zhì)就是軟件可復用技術。COM GIS就是采用了面向?qū)ο蠹夹g和組件軟件技術的GIS系統(tǒng),其基本思想是把GIS的各大功能模塊劃分為幾個組件,每個組件完成不同的功能。各個GIS組件之間以及GIS組件與非GIS組件之間,都可以方便地通過可視化的軟件開發(fā)工具集成起來,形成最終的GIS基礎平臺及應用系統(tǒng)。組件式GIS代表著當今GIS發(fā)展的潮流。
(5)Web GIS技術。Web GIS是在INTERNET信息發(fā)布、數(shù)據(jù)共享、交流協(xié)作基礎之上實現(xiàn)GIS的在線查詢和業(yè)務處理等功能,是Internet技術應用于GIS開發(fā)的產(chǎn)物?;ヂ?lián)網(wǎng)(Internet),尤其是萬維網(wǎng)(WWW),已經(jīng)成為GIS的新的操作平臺。GIS通過WWW功能得以擴展,真正成為一種大眾使用的工具,從WWW的任意一個節(jié)點,Internet用戶可以瀏覽Web GIS站點中的空間數(shù)據(jù)、制作專題圖,以及進行各種空間檢索和空間分析,從而使GIS進入千家萬戶。
龍軟科技四大專利之-GIS協(xié)同“一張圖”及智能管控平臺組
科創(chuàng)板煤炭工業(yè)軟件龍頭企業(yè)龍軟 科技 (688078.SH)是一家基于LongRuan GIS +互聯(lián)網(wǎng)+大數(shù)據(jù)+云計算,并為智能煤礦信息化領域提供整體解決方案的高 科技 公司。其中,公司最硬核的技術及相關專利之一,是龍軟 科技 憑借多年行業(yè)積累,基于自主研發(fā)的LongRuan GIS 打造的智能煤礦“一張圖”。
如同百度、高德和谷歌等民用地圖改變?nèi)藗兊某鲂蟹绞揭粯樱琇ongRuan GIS “一張圖”綜合解決方案,通過技術創(chuàng)新推動了煤礦傳統(tǒng)的管理模式變革,為構建智能煤礦的信息化管理模式提供了高 科技 支持。
什么是“一張圖” ?
龍軟 科技 “一張圖”是GIS(地理信息系統(tǒng))技術在煤礦行業(yè)的創(chuàng)新應用?!耙粡垐D”是一種創(chuàng)新管理模式, 是煤礦的BI(商業(yè)智能), 也是煤礦技術人員的SVN/GIT(分布式版本控制系統(tǒng))。
“一張圖”及智能管控平臺是一個面向行業(yè)數(shù)據(jù)庫的大型數(shù)據(jù)倉庫,它通過綜合信息監(jiān)管來提取對業(yè)務的分析信息,且無論是原始數(shù)據(jù)還是挖掘分析后的信息,都可以通過基礎服務平臺向外提供服務訪問和交互。具體到煤礦方面,實現(xiàn)了礦山“采、掘、機、運、通”相關的安全生產(chǎn)、監(jiān)測監(jiān)控、安全管理等業(yè)務和數(shù)據(jù)與基礎地理數(shù)據(jù)的疊加集成、匯交更新。各業(yè)務單位分工協(xié)作、各司其職,共同構建起礦山一張圖,為安全生產(chǎn)、動態(tài)監(jiān)控、經(jīng)營決策等提供多維數(shù)據(jù)支持。
突破關鍵技術 釋放創(chuàng)新能量
一直以來龍軟 科技 在自主創(chuàng)新研發(fā)方面投入巨大。截至目前,公司取得煤礦信息化、智能化領域相關專利權54項(其中發(fā)明專利31項)、軟件著作權242項。研發(fā)團隊瞄準了行業(yè)痛點,已逐步形成了“四大”核心專利技術組:(1)GIS協(xié)同“一張圖”及智能管控平臺相關專利組;(2)智能綜采綜掘工作面相關專利組;(3)透明化礦山相關專利組;(4)礦山新型開采方式及裝備的相關專利組。
其中,第一大專利組GIS協(xié)同“一張圖”及智能管控平臺相關專利主要涉及六項高價值的創(chuàng)新型專利:(一)“煤礦分布式協(xié)同一張圖系統(tǒng)及協(xié)同管理方法”(二)“一種礦井信息化管理多專業(yè)巷道圖形的動態(tài)更新方法”(三)“一種基于時態(tài)GIS的煤礦可視化管控系統(tǒng)”(四)“一種交互式注記等值線數(shù)值的方法和裝置”;(五)“一種參數(shù)式煤礦井下供電設計方法”(六)“一種快速生成煤層小柱狀的方法和裝置”。
據(jù)了解,該組專利涵蓋了煤礦時空數(shù)據(jù)“一張圖”協(xié)同處理及管控平臺應用。
專利一“煤礦分布式協(xié)同一張圖系統(tǒng)及協(xié)同管理方法”, 提出了煤礦多專業(yè)數(shù)據(jù)統(tǒng)一管理、動態(tài)即時更新和共享的方法,奠定了煤礦“一張圖”系統(tǒng)的關鍵技術基礎,最早形成了煤炭行業(yè)信息化建設“一張圖”模式。2017年龍軟 科技 基于項目研發(fā)成果申請了發(fā)明專利,并于2019年獲得授權。項目技術成果“煤礦空間信息服務與管理關鍵技術研究及產(chǎn)業(yè)化應用”,獲2018年中國煤炭工業(yè)科學技術一等獎。
專利二“一種礦井信息化管理多專業(yè)巷道圖形的動態(tài)更新方法”, 基于煤礦“一張圖”技術體系,圍繞煤礦數(shù)據(jù)規(guī)范化管理和自動化處理應用問題,提出了基于協(xié)同思想的煤礦巷道圖形動態(tài)更新方法,解決了煤礦地測專題圖形、一通防專題圖形、機電設備布置專題圖形、監(jiān)測監(jiān)控專題圖形中必不可少的巷道動態(tài)更新難題。由于巷道數(shù)據(jù)是煤礦各類專題圖形的最基礎內(nèi)容,該專利適應于幾乎所有應用“一張圖”模式的煤礦專題圖處理和更新,是該領域必不可少的技術方法。龍軟 科技 于2020年獲得該項發(fā)明專利授權。
專利三“一種基于時態(tài)GIS的煤礦可視化管控系統(tǒng)” ,提出了基于時態(tài)地理信息系統(tǒng)TGIS“一張圖”和透明化礦山的煤礦二三維一體化管控平臺技術和方法,奠定了煤礦可視化管控平臺及透明化智能開采的關鍵技術基礎,融合地理空間場景構建、傳感數(shù)據(jù)采集與通訊、腳本化模型驅(qū)動等技術,形成了以實時、動態(tài)地理信息為支撐的礦井二維、三維可視化管控新模式。2021年龍軟 科技 獲得該項發(fā)明專利授權。
此外,結合煤礦地理信息系統(tǒng)及“一張圖”平臺應用中的日常需求,針對等值線生成、小柱狀繪制、供電系統(tǒng)設計等問題,創(chuàng)新提出并形成了“交互式注記等值線”、“快速生成煤層小柱狀”、“參數(shù)式煤礦井下供電設計”等發(fā)明專利?;谝陨舷盗袑@井a(chǎn)品可以為煤礦時空數(shù)據(jù)的處理提供更高效、便捷的處理支持,進而形成統(tǒng)一、規(guī)范、完整、動態(tài)更新的煤礦“一張圖”時空數(shù)據(jù)庫和管控平臺,并最終建立“基于多維GIS或圖形處理技術的煤礦可視化管控系統(tǒng)”,實現(xiàn)煤礦自動化、智能化工業(yè)控制和可視化多維地理信息的一體化集成。
公司始終從煤礦智能化需求出發(fā),通過分布式協(xié)同一張圖的理念,改變了煤炭行業(yè)傳統(tǒng)的單機工作模式,建立了煤礦多專業(yè)業(yè)務數(shù)據(jù)的統(tǒng)一管理、協(xié)同處理、動態(tài)更新、可視化管控體系,并通過創(chuàng)新的巷道多專業(yè)更新等技術方法,提高煤礦時空數(shù)據(jù)處理的效率及完整性,解決了阻礙煤炭行業(yè)信息化、智能化建設的數(shù)據(jù)孤島嚴重、跨專業(yè)無法協(xié)同、跨部門管理困難、數(shù)據(jù)實時性不高等難題,解決行業(yè)痛點,為煤炭行業(yè)信息化、智能化建設開辟了基于時空地理信息系統(tǒng)的“一張圖”綜合管控和自適應智能開采模式,給煤炭企業(yè)帶來一種全新的、適應“智能礦山”信息化建設要求的新型信息化管理模式。
多應用領域推動產(chǎn)業(yè)升級
“一張圖”協(xié)同處理及管控平臺應用對象可以是單個煤礦,也可以是多級架構的煤礦企業(yè)集團,分布式架構的自身特點決定了“一張圖”系列產(chǎn)品具有極強的適應性,可應用于多個領域與場景。無論對于大型煤礦企業(yè)集團,還是中小煤礦企業(yè),“一張圖”產(chǎn)品解決的統(tǒng)一空間數(shù)據(jù)存儲和分析應用平臺問題均是煤礦信息化建設中的核心問題之一,也是當前實現(xiàn)煤礦智能開采必須面對和解決的基礎問題。
目前,公司憑借著“一張圖”協(xié)同處理及管控平臺相關專利技術已成功已應用于陜西陜煤黃陵礦業(yè)有限公司一號煤礦“黃陵一號煤礦礦井智能綜合管控云平臺”、河南煤化集團永煤集團新橋煤礦“安全生產(chǎn)智慧管控平臺”、江蘇徐礦能源股份有限公司張雙樓煤礦“智能GIS“一張圖”平臺”、國家能源集團新疆能源烏東煤礦“基于急傾斜煤層的一張圖智能管控平臺”、山東能源兗煤股份東灘煤礦“智能礦山綜合信息管控系統(tǒng)”、中煤陜西榆林能源化工有限公司大海則煤礦“生產(chǎn)執(zhí)行系統(tǒng)”等智能化建設示范礦井。
實踐表明,基于GIS協(xié)同“一張圖”、虛擬礦井、大數(shù)據(jù)安全動態(tài)診斷等核心技術專利的研發(fā),解決了高度一體化管控的智慧、高 科技 礦區(qū)的關鍵問題?!耙粡垐D”管理系統(tǒng)的推廣與實施,將為我國智能礦山建設奠定堅實的基礎,不僅能夠減員增效,而且還能進一步保障礦井安全生產(chǎn)。龍軟 科技 作為專注于行業(yè)發(fā)展的高新技術企業(yè),具有持續(xù)、強大的創(chuàng)新能力,對推動我國煤炭工業(yè)安全生產(chǎn)技術的信息化管理具有重要的 社會 效益。
什么是時態(tài)GIS
加入時間維度后的GIS
一般來說傳統(tǒng)的GIS是2D或3D的,加入時態(tài)后就可以成為4D
GIS基本技術有哪些?
引言
地理信息系統(tǒng)(Geographic Information System,簡稱GIS)是計算機科學、地理學、測量學、地圖學等多門學科綜合的技術[1]。GIS的基本技術是空間數(shù)據(jù)庫、地圖可視化及空間分析,而空間數(shù)據(jù)庫是GIS的關鍵??臻g數(shù)據(jù)挖掘技術作為當前數(shù)據(jù)庫技術最活躍的分支與知識獲取手段,在GIS中的應用推動著GIS朝智能化和集成化的方向發(fā)展。
1 空間數(shù)據(jù)庫與空間數(shù)據(jù)挖掘技術的特點
隨著數(shù)據(jù)庫技術的不斷發(fā)展和數(shù)據(jù)庫管理系統(tǒng)的廣泛應用,數(shù)據(jù)庫中存儲的數(shù)據(jù)量也在急劇增大,在這些海量數(shù)據(jù)的背后隱藏了很多具有決策意義的信息。但是,現(xiàn)今數(shù)據(jù)庫的大多數(shù)應用仍然停留在查詢、檢索階段,數(shù)據(jù)庫中隱藏的豐富的知識遠遠沒有得到充分的發(fā)掘和利用,數(shù)據(jù)庫中數(shù)據(jù)的急劇增長和人們對數(shù)據(jù)庫處理和理解的困難形成了強烈的反差,導致“人們被數(shù)據(jù)淹沒,但卻饑餓于知識”的現(xiàn)象。
空間數(shù)據(jù)庫(數(shù)據(jù)倉庫)中的空間數(shù)據(jù)除了其顯式信息外,還具有豐富的隱含信息,如數(shù)字高程模型〔DEM或TIN〕,除了載荷高程信息外,還隱含了地質(zhì)巖性與構造方面的信息;植物的種類是顯式信息,但其中還隱含了氣候的水平地帶性和垂直地帶性的信息,等等。這些隱含的信息只有通過數(shù)據(jù)挖掘才能顯示出來??臻g數(shù)據(jù)挖掘(Spatial Data Mining,簡稱SDM),或者稱為從空間數(shù)據(jù)庫中發(fā)現(xiàn)知識,是為了解決空間數(shù)據(jù)海量特性而擴展的一個新的數(shù)據(jù)挖掘的研究分支,是指從空間數(shù)據(jù)庫中提取隱含的、用戶感興趣的空間或非空間的模式和普遍特征的過程[2]。由于SDM的對象主要是空間數(shù)據(jù)庫,而空間數(shù)據(jù)庫中不僅存儲了空間事物或?qū)ο蟮膸缀螖?shù)據(jù)、屬性數(shù)據(jù),而且存儲了空間事物或?qū)ο笾g的圖形空間關系,因此其處理方法有別于一般的數(shù)據(jù)挖掘方法。SDM與傳統(tǒng)的地學數(shù)據(jù)分析方法的本質(zhì)區(qū)別在于SDM是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)知識,挖掘出的知識應具有事先未知、有效和可實用3個特征。
空間數(shù)據(jù)挖掘技術需要綜合數(shù)據(jù)挖掘技術與空間數(shù)據(jù)庫技術,它可用于對空間數(shù)據(jù)的理解,對空間關系和空間與非空間關系的發(fā)現(xiàn)、空間知識庫的構造以及空間數(shù)據(jù)庫的重組和查詢的優(yōu)化等。
2 空間數(shù)據(jù)挖掘技術的主要方法及特點
常用的空間數(shù)據(jù)挖掘技術包括:序列分析、分類分析、預測、聚類分析、關聯(lián)規(guī)則分析、時間序列分析、粗集方法及云理論等。本文從挖掘任務和挖掘方法的角度,著重介紹了分類分析、聚類分析和關聯(lián)規(guī)則分析三種常用的重要的方法。
2.1、分類分析
分類在數(shù)據(jù)挖掘中是一項非常重要的任務,目前在商業(yè)上應用最多。分類的目的是學會一個分類函數(shù)或分類模型(也常常稱作分類器),該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個。分類和我們熟知的回歸方法都可用于預測,兩者的目的都是從歷史數(shù)據(jù)紀錄中自動推導出對給定數(shù)據(jù)的推廣描述,從而能對未來數(shù)據(jù)進行預測。和回歸方法不同的是,分類的輸出是離散的類別值,而回歸的輸出則是連續(xù)的數(shù)值。二者常表現(xiàn)為一棵決策樹,根據(jù)數(shù)據(jù)值從樹根開始搜索,沿著數(shù)據(jù)滿足的分支往上走,走到樹葉就能確定類別。空間分類的規(guī)則實質(zhì)是對給定數(shù)據(jù)對象集的抽象和概括,可用宏元組表示。
要構造分類器,需要有一個訓練樣本數(shù)據(jù)集作為輸入。訓練集由一組數(shù)據(jù)庫記錄或元組構成,每個元組是一個由特征(又稱屬性)值組成的特征向量,此外,訓練樣本還有一個類別標記。一個具體樣本的形式可為:( v1, v2, ..., vn; c );其中vi表示字段值,c表示類別。
分類器的構造方法有統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法等等。統(tǒng)計方法包括貝葉斯法和非參數(shù)法(近鄰學習或基于事例的學習),對應的知識表示是判別函數(shù)和原型事例。機器學習方法包括決策樹法和規(guī)則歸納法,前者對應的表示為決策樹或判別樹,后者則一般為產(chǎn)生式規(guī)則。神經(jīng)網(wǎng)絡方法主要是反向傳播(Back-Propagation,簡稱BP)算法,它的模型表示是前向反饋神經(jīng)網(wǎng)絡模型(由代表神經(jīng)元的節(jié)點和代表聯(lián)接權值的邊組成的一種體系結構),BP算法本質(zhì)上是一種非線性判別函數(shù)[3]。另外,最近又興起了一種新的方法:粗糙集(rough set),其知識表示是產(chǎn)生式規(guī)則。
不同的分類器有不同的特點。有三種分類器評價或比較尺度:1) 預測準確度;2) 計算復雜度;3) 模型描述的簡潔度。預測準確度是用得最多的一種比較尺度,特別是對于預測型分類任務,目前公認的方法是10番分層交叉驗證法。計算復雜度依賴于具體的實現(xiàn)細節(jié)和硬件環(huán)境,在數(shù)據(jù)挖掘中,由于操作對象是海量的數(shù)據(jù)庫,因此空間和時間的復雜度問題將是非常重要的一個環(huán)節(jié)。對于描述型的分類任務,模型描述越簡潔越受歡迎。例如,采用規(guī)則歸納法表示的分類器構造法就很有用,而神經(jīng)網(wǎng)絡方法產(chǎn)生的結果就難以理解。
另外要注意的是,分類的效果一般和數(shù)據(jù)的特點有關。有的數(shù)據(jù)噪聲大,有的有缺值, 有的分布稀疏,有的字段或?qū)傩蚤g相關性強,有的屬性是離散的而有的是連續(xù)值或混合式的。目前普遍認為不存在某種方法能適合于各種特點的數(shù)據(jù)。
分類技術在實際應用非常重要,比如:可以根據(jù)房屋的地理位置決定房屋的檔次等。
2. 2 聚類分析
聚類是指根據(jù)“物以類聚”的原理,將本身沒有類別的樣本聚集成不同的組,并且對每一個這樣的組進行描述的過程。它的目的是使得屬于同一個組的樣本之間應該彼此相似,而不同組的樣本應足夠不相似。與分類分析不同,進行聚類前并不知道將要劃分成幾個組和什么樣的組,也不知道根據(jù)哪些空間區(qū)分規(guī)則來定義組。其目的旨在發(fā)現(xiàn)空間實體的屬性間的函數(shù)關系,挖掘的知識用以屬性名為變量的數(shù)學方程來表示。聚類方法包括統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法和面向數(shù)據(jù)庫的方法?;诰垲惙治龇椒ǖ目臻g數(shù)據(jù)挖掘算法包括均值近似算法[4]、CLARANS、BIRCH、DBSCAN等算法。目前,對空間數(shù)據(jù)聚類分析方法的研究是一個熱點。
對于空間數(shù)據(jù),利用聚類分析方法,可以根據(jù)地理位置以及障礙物的存在情況自動地進行區(qū)域劃分。例如,根據(jù)分布在不同地理位置的ATM機的情況將居民進行區(qū)域劃分,根據(jù)這一信息,可以有效地進行ATM機的設置規(guī)劃,避免浪費,同時也避免失掉每一個商機。
2.3 關聯(lián)規(guī)則分析
關聯(lián)規(guī)則分析主要用于發(fā)現(xiàn)不同事件之間的關聯(lián)性,即一事物發(fā)生時,另一事物也經(jīng)常發(fā)生。關聯(lián)分析的重點在于快速發(fā)現(xiàn)那些有實用價值的關聯(lián)發(fā)生的事件。其主要依據(jù)是:事件發(fā)生的概率和條件概率應該符合一定的統(tǒng)計意義。空間關聯(lián)規(guī)則的形式是X->Y[S%,C%],其中X、Y是空間或非空間謂詞的集合,S%表示規(guī)則的支持度,C%表示規(guī)則的置信度。空間謂詞的形式有3種:表示拓撲結構的謂詞、表示空間方向的謂詞和表示距離的謂詞[5]。各種各樣的空間謂詞可以構成空間關聯(lián)規(guī)則。如,距離信息(如Close_to(臨近)、Far_away(遠離))、拓撲關系(Intersect(交)、Overlap(重疊)、Disjoin(分離))和空間方位(如Right_of(右邊)、West_of(西邊))。實際上大多數(shù)算法都是利用空間數(shù)據(jù)的關聯(lián)特性改進其分類算法,使得它適合于挖掘空間數(shù)據(jù)中的相關性,從而可以根據(jù)一個空間實體而確定另一個空間實體的地理位置,有利于進行空間位置查詢和重建空間實體等。大致算法可描述如下:(1)根據(jù)查詢要求查找相關的空間數(shù)據(jù);(2)利用臨近等原則描述空間屬性和特定屬性;(3)根據(jù)最小支持度原則過濾不重要的數(shù)據(jù);(4)運用其它手段對數(shù)據(jù)進一步提純(如OVERLAY);(5)生成關聯(lián)規(guī)則。
關聯(lián)規(guī)則通常可分為兩種:布爾型的關聯(lián)規(guī)則和多值關聯(lián)規(guī)則。多值關聯(lián)規(guī)則比較復雜,一種自然的想法是將它轉(zhuǎn)換為布爾型關聯(lián)規(guī)則,由于空間關聯(lián)規(guī)則的挖掘需要在大量的空間對象中計算多種空間關系,因此其代價是很高的?!N逐步求精的挖掘優(yōu)化方法可用于空間關聯(lián)的分析,該方法首先用一種快速的算法粗略地對一個較大的數(shù)據(jù)集進行一次挖掘,然后在裁減過的數(shù)據(jù)集上用代價較高的算法進一步改進挖掘的質(zhì)量。因為其代價非常高,所以空間的關聯(lián)方法需要進一步的優(yōu)化。
對于空間數(shù)據(jù),利用關聯(lián)規(guī)則分析,可以發(fā)現(xiàn)地理位置的關聯(lián)性。例如,85%的靠近高速公路的大城鎮(zhèn)與水相鄰,或者發(fā)現(xiàn)通常與高爾夫球場相鄰的對象是停車場等。
3 空間數(shù)據(jù)挖掘技術的研究方向
3.1 處理不同類型的數(shù)據(jù)
絕大多數(shù)數(shù)據(jù)庫是關系型的,因此在關系數(shù)據(jù)庫上有效地執(zhí)行數(shù)據(jù)挖掘是至關重要的。但是在不同應用領域中存在各種數(shù)據(jù)和數(shù)據(jù)庫,而且經(jīng)常包含復雜的數(shù)據(jù)類型,例如結構數(shù)據(jù)、復雜對象、事務數(shù)據(jù)、歷史數(shù)據(jù)等。由于數(shù)據(jù)類型的多樣性和不同的數(shù)據(jù)挖掘目標,一個數(shù)據(jù)挖掘系統(tǒng)不可能處理各種數(shù)據(jù)。因此針對特定的數(shù)據(jù)類型,需要建立特定的數(shù)據(jù)挖掘系統(tǒng)。
3.2 數(shù)據(jù)挖掘算法的有效性和可測性
海量數(shù)據(jù)庫通常有上百個屬性和表及數(shù)百萬個元組。GB數(shù)量級數(shù)據(jù)庫已不鮮見,TB數(shù)量級數(shù)據(jù)庫已經(jīng)出現(xiàn),高維大型數(shù)據(jù)庫不僅增大了搜索空間,也增加了發(fā)現(xiàn)錯誤模式的可能性。因此必須利用領域知識降低維數(shù),除去無關數(shù)據(jù),從而提高算法效率。從一個大型空間數(shù)據(jù)庫中抽取知識的算法必須高效、可測量,即數(shù)據(jù)挖掘算法的運行時間必須可預測,且可接受,指數(shù)和多項式復雜性的算法不具有實用價值。但當算法用有限數(shù)據(jù)為特定模型尋找適當參數(shù)時,有時也會導致物超所值,降低效率。
3.3 交互性用戶界面
數(shù)據(jù)挖掘的結果應準確地描述數(shù)據(jù)挖掘的要求,并易于表達。從不同的角度考察發(fā)現(xiàn)的知識,并以不同形式表示,用高層次語言和圖形界面表示數(shù)據(jù)挖掘要求和結果。目前許多知識發(fā)現(xiàn)系統(tǒng)和工具缺乏與用戶的交互,難以有效利用領域知識。對此可以利用貝葉斯方法和演譯數(shù)據(jù)庫本身的演譯能力發(fā)現(xiàn)知識。
3.4 在多抽象層上交互式挖掘知識
很難預測從數(shù)據(jù)庫中會挖掘出什么樣的知識,因此一個高層次的數(shù)據(jù)挖掘查詢應作為進一步探詢的線索。交互式挖掘使用戶能交互地定義一個數(shù)據(jù)挖掘要求,深化數(shù)據(jù)挖掘過程,從不同角度靈活看待多抽象層上的數(shù)據(jù)挖掘結果。
3.5 從不同數(shù)據(jù)源挖掘信息
局域網(wǎng)、廣域網(wǎng)以及Internet網(wǎng)將多個數(shù)據(jù)源聯(lián)成一個大型分布、異構的數(shù)據(jù)庫,從包含不同語義的格式化和非格式化數(shù)據(jù)中挖掘知識是對數(shù)據(jù)挖掘的一個挑戰(zhàn)。數(shù)據(jù)挖掘可揭示大型異構數(shù)據(jù)庫中存在的普通查詢不能發(fā)現(xiàn)的知識。數(shù)據(jù)庫的巨大規(guī)模、廣泛分布及數(shù)據(jù)挖掘方法的計算復雜性,要求建立并行分布的數(shù)據(jù)挖掘。
3.6 私有性和安全性
數(shù)據(jù)挖掘能從不同角度、不同抽象層上看待數(shù)據(jù),這將影響到數(shù)據(jù)挖掘的私有性和安全性。通過研究數(shù)據(jù)挖掘?qū)е碌臄?shù)據(jù)非法侵入,可改進數(shù)據(jù)庫安全方法,以避免信息泄漏。
3.7 和其它系統(tǒng)的集成
方法、功能單一的發(fā)現(xiàn)系統(tǒng)的適用范圍必然受到一定的限制。要想在更廣泛的領域發(fā)現(xiàn)知識,空間數(shù)據(jù)挖掘系統(tǒng)就應該是數(shù)據(jù)庫、知識庫、專家系統(tǒng)、決策支持系統(tǒng)、可視化工具、網(wǎng)絡等技術的集成。
4 有待研究的問題
我們雖然在空間數(shù)據(jù)挖掘技術的研究和應用中取得了很大的成績,但在一些理論及應用方面仍存在急需解決的問題。
4.1 數(shù)據(jù)訪問的效率和可伸縮性
空間數(shù)據(jù)的復雜性和數(shù)據(jù)的大量性,TB數(shù)量級的數(shù)據(jù)庫的出現(xiàn),必然增大發(fā)現(xiàn)算法的搜索空間,增加了搜索的盲目性。如何有效的去除與任務無關的數(shù)據(jù),降低問題的維數(shù),設計出更加高效的挖掘算法對空間數(shù)據(jù)挖掘提出了巨大的挑戰(zhàn)。
4.2 對當前一些GIS軟件缺乏時間屬性和靜態(tài)存儲的改進
由于數(shù)據(jù)挖掘的應用在很大的程度上涉及到時序關系,因此靜態(tài)的數(shù)據(jù)存儲嚴重妨礙了數(shù)據(jù)挖掘的應用?;趫D層的計算模式、不同尺度空間數(shù)據(jù)之間的完全割裂也對空間數(shù)據(jù)挖掘設置了重重障礙??臻g實體與屬性數(shù)據(jù)之間的聯(lián)系僅僅依賴于標識碼,這種一維的連接方式無疑將丟失大量的連接信息,不能有效的表示多維和隱含的內(nèi)在連接關系,這些都增加了數(shù)據(jù)挖掘計算的復雜度,極大地增加了數(shù)據(jù)準備階段的工作量和人工干預的程度。
4.3 發(fā)現(xiàn)模式的精煉
當發(fā)現(xiàn)空間很大時會獲得大量的結果,盡管有些是無關或沒有意義的模式,這時可利用領域的知識進一步精煉發(fā)現(xiàn)的模式,從而得到有意義的知識。
在空間數(shù)據(jù)挖掘技術方面,重要的研究和應用的方向還包括:網(wǎng)絡環(huán)境上的數(shù)據(jù)挖掘、柵格矢量一體化的挖掘、不確定性情況下的數(shù)據(jù)挖掘、分布式環(huán)境下的數(shù)據(jù)挖掘、數(shù)據(jù)挖掘查詢語言和新的高效的挖掘算法等。
5 小結
隨著GIS與數(shù)據(jù)挖掘及相關領域科學研究的不斷發(fā)展,空間數(shù)據(jù)挖掘技術在廣度和深度上的不斷深入,在不久的將來,一個集成了挖掘技術的GIS、GPS、RS集成系統(tǒng)必將朝著智能化、網(wǎng)絡化、全球化與大眾化的方向發(fā)展。
網(wǎng)頁名稱:時態(tài)gis的關鍵技術 時態(tài)gis名詞解釋
本文地址:http://www.dlmjj.cn/article/ddocgdd.html