|  客服中心  |  合作联系
搜刊网
论文下载
您当前位置
首页 > 论文下载 > 基础科学 > 基于文本的地理空间数据挖掘与可视化
基于文本的地理空间数据挖掘与可视化
来源:互联网 qikanw | 刘元凤1 , 周荣福2 , 李凤玲3
【分  类】 基础科学
【关 键 词】 庐山山北第二路;文本挖掘;数据字典;查询 
【来  源】 互联网
【收  录】 中文学术期刊网
正文:

    第三部分,建立数据库。将空间数据和包含了景区图片的属性数据导入进Arcview的属性数据库中。
    第四部分,根据shape文件,编辑点、线图层,在其中设置地图显示风格,以及地图中地物各分析功能的查询等。将采集的数据和图片用可视化的方式进行显示,同时对用户提供信息导航功能,从而在极大的程度上方便用户浏览和获取信息。
3.2《庐山志》数据字典的创建
古人以自然语言、语义,用词方式,词义表达的逻辑方法来记录地理空间信息,与现代语言比较是相当迥异的,如方位用词“内、上、下、西北、其北、东南、前、底后、左、右……”,名称称谓“名、即、曰、旧曰、亦名、呼为、现为、改为、古称……”,谓语“有、为、在、去、入、行、至、过……”,距离“里”等等。
针对《庐山志》山北第二路文言文进行文本挖掘,分为这样几个步骤:
1)地理文本的收集和预处理:采集《庐山志》山北第二路的文言文描述章节(第94—153页),将PDF文档转换成TXT文档,分页进行转换文本存储格式,去除149—153页注释部分,创建山北第二路的文言文内容形式的地理文献资料。
2)地理空间特征的表示和提取:在相关辅助工具的帮助下,通篇熟读文献,大略理解作者的词义表达后,筛选出一些与地理空间数据相关的古文,再将其译成现代用语。解读文献资料,从地理文本中抽取代表相关地物的地理空间特征的元数据,如地物名称、地理方位、路线等等,这些特征暂时存储于文档中,以备绘制模拟草图。
 3)模型的地理数据筛选与类型分类:从挖掘后的地理空间数据筛选出各类地物的空间特征信息,如地物名称、方位、修建日期、修建者、简短的描述、诗人、原名、现名,同时从网站中采集相关旅游景点的图片,建立好图片库与描述行文本库。进而,把点地物和线地物的特征空间信息分离开,然后分门别类地将分类类型起草完。例如“妙智铺西南行,经刷子桥,再西南循西干道至蛇冈岭” ;“由妙智五里至蛇冈”;“蛇冈之下五里,至太平观”;“咏真洞,去城三十里,在太平宫后山,一名飞云洞”;“(东林寺)寺晋武帝太和十年建,唐号太平兴龙寺”;“东林寺西,为西林寺”;“报国寺去云峰寺西南半里许,在天池山下,寺久废”;“将军河东上,为金竹坪,背枕九奇,面对铁船”。对照古今译表,挖掘地物名称、现状(已废或现存)以及其之间的地理方位、距离。确立好地物之间的拓扑关系、方位关系,再进行庐山历史风景线路图的绘制。
 4) 挖掘结果评价:对地理文本挖掘得到的空间信息进行评价,将符合一定标准的信息呈现给用户。
    5) 信息表示和信息导航:通过Arcview3.2常用的新建View视图,进行庐山历史景点模拟地图的绘制,同时添加空间数据库、属性数据库,完成相关数据的显示、查询、统计与分析等功能。客户也可自主编辑使用图层管理器,实现地图操作。
3.3 空间与属性数据库的设计与实现
《庐山志》中地理信息种类繁多、内容丰富,如何将它们进行有机的组织、有效的存储、管理和检索应用是一项十分重要的工作。在该系统中,研究模型的空间数据与属性数据统一存放在基于关系型数据库内, 通过元数据进行描述, 实现数据的统一管理, 从而达到数据集成的目的。将来可在此基础上, 通过图文一体化技术、数据交换平台技术和网络通讯技术, 使本系统得以与其它应用系统进行关联和耦合, 从而在更大的信息应用范畴中充分发挥作用, 为政府的相关决策提供辅助支持。
3.3.1 点地物命名、分类及对应属性名的编码依据
    山北第二路内分为6大类点地物,地物名及对应编码:(1)寺11、观12、伺13、庙14、禅院15、16厣;(2)台21、塔22、桥23、庭24;(3)山31、峰32、岩33、谷34、寇35、岭36、崖37、屉38;(4)瀑布41、溪42、河43、泉44、潭45、湖46、池47、洞48;(5)地方51;(6)堂61、宫62、铺63
点地物数据库表设计了7个属性字段,分类号:即地物名对应的编码;古称:从《庐山志》的山北第二路文言文的文本数据挖掘出;现称:浏览相关网页、文献、杂志等资料查询到;备注(已废/不可考):从《庐山志》的山北第二路文言文的文本数据挖掘出地物名称,虽出现在文本中,但现实里已经不覆存在,或已废除,或已不可考,所以加以标记;最近景点:在创建山北第二路的点图层数据库后,从图库中查询出进行标释,可分为4种情况:(1)本身是著名观光景点(2)自己不是著名景点,以上方最近景点加载 (3)自己不是著名景点,上方也无景点,就以左方距离最近景点名加载(4)若上述情况都不符合,就以离自身最近著名地物名添加;最近路线:在创建山北第二路的线图层库后,从图库中查询出进行标释,即此地物所在地距离最近的主要路线名;最近景点的图片:即离地物最近的著名景点图片。
3.3.2  线路名命名、分类及对应属性名的编码依据
   考虑当时时代发展不发达,只能设定可行使车的马路(较宽路),即当时的庐山山路主干线,和仅行人攀登的崎岖小道或羊肠小径(窄且险)。
1.线类地物分类:a、马路(1) ; b、山路(2)
2.路可以分为山北路N与山西路W,路名编码的依据:1)若本身为主干道,则路名编码为主干道编号;2)若其为次干道,则路名编码为主干道编号+所在分支号;3)若其为次干道的分支小道,则路名编码为主干道编号+所在分支号+分支小道的编号。如n010203,w05010。
   3. 道路方向的编码原则,分为八个角度:东0;东北1;北2;西北3;西4;西南5;南6;东南7。
   4. 历史道路模拟距离的设定
  表1  历史道路模拟距离表             
图上距离 文本估计值/里 图上距离 文本估计值/里
0.150以下 0.5 1.000—1.099 5.5
0.150—0.199 1.0 1.100—1.199 6.0
0.200—0.299 1.5 1.200—1.299 6.5
0.300—0.399 2.0 1.300—1.399 7.0
0.400—0.499 2.5 1.400—1.499 7.5
0.500—0.599 3.0 1.500—1.599 8.0
0.600—0.699 3.5 1.600—1.699 8.5
0.700—0.799 4.0 1.700—1.799 9.0
0.800—0.899 4.5 1.800—1.899 9.5
0.900—0.999 5.0    
点地物数据库表设计了5个属性字段, Id:古道所在类中的代号;Scale:马路(1)、山路(2);Direction:古道所在干线的指向;Nplace:此路的最近景点名称;Length_Nomical:当时路线代表的估测里数。
相关推荐
热门期刊
台湾农业探索《台湾农业探索》
《台湾农业探索》杂志,于1984年经国家新闻出版总署批准正式创刊,CN:35-1190/S,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、时效性强的特点,其中主要栏目有:两岸特...
社会主义研究《社会主义研究》
《社会主义研究》杂志,于1978年经国家新闻出版总署批准正式创刊,CN:42-1093/D,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、时效性强的特点,其中主要栏目有:中国和...
大众硬件《大众硬件》
《大众硬件》是由大众软件杂志社主办,于2003年1月创刊的一本以电脑硬件为主要内容的杂志,目前为月刊。以马列主义、毛泽东思想、邓小平理论和“三个代表”重要思想...
大连理工大学学报(社会科学版)《大连理工大学学报(社会科学版)》
《大连理工大学学报(社会科学版)》(季刊)创刊于1980年,是由大连理工大学主办的学术刊物。 《大连理工大学学报(社会科学版)》涵盖人文科学、社会科学、管理科学,以及交叉...
江西煤炭科技《江西煤炭科技》
《江西煤炭科技》(季刊)创刊于1979年,是由江西省煤炭集团公司,江西省煤炭学会,江西省煤炭经济研究会,江西省煤炭工业科研所主办的煤炭工业刊物。重点报道全省煤炭生...
化学研究《化学研究》
《化学研究》杂志,于1997年经国家新闻出版总署批准正式创刊,CN:41-1083/06,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、时效性强的特点,其中主要栏目有:研究论文、...
友情链接
中教杯 国家新闻出版总署 中国知网 万方数据 维普网 中国科学院 中国国家图书馆 央视英文版 中国留学网 中青网 中国国家人才网 中国经济网 中国日报网 中国新闻网 中国学术期刊网
关于我们
平台简介
诚聘英才
企业文化
竞争优势
版权信息
服务条款
客服承诺
常见问题
版权声明
合作加盟
期刊加盟
广告服务
联系我们
网站导航
期刊大全
论文下载
课题申报
学术会议
编辑QQ
编辑联络
2007-2023
中文学术期刊检索机构
bianjibu777@qq.com
联系我们

版权所有©2007- 2023 中国学术期刊网(qikanw.com) All Rights Reserved 京ICP备2021008252号
本站是学术论文网络平台,若期刊网有侵犯您的版权,请及时与期刊网客服取得联系,联系信箱: bianjibu777@qq.com    
中国学术期刊网