南宫28官方网站消息通讯的观念十篇
具体介绍

  观点模子通过一套正途化的符号叙话描画实际宇宙,是讯息编制开垦中记载编制需求的紧要用具,如E-R图、数据流程图、UML等。记载的编制需求成为项目中各方疏通的引子:编制阐发员与用户疏通以确认编制需求;编制开垦职员间疏通开垦细节。分明,两方面疏通均有用本领担保开垦出符适用户需求的操纵编制。而以往琢磨众闭怀编制开垦职员间的疏通,鄙夷了与用户的疏通。

  方今,用户插手需求阐发愈加被侧重,有用的用户插手被以为是编制凯旋和用户惬心的有力保证。Davies等人的侦察评释,与用户的疏通有用性跨越其他技巧和处分成分,成为观点模子运用中最紧要的题目。然而还缺乏直接的琢磨和证据证明观点模子正在与用户疏通中的用意机理。

  鉴于此,本文将以观点模子与用户疏通流程中的认知特征为底子,阐发和证明观点模子影响疏通效率的用意机理,并通过测验室琢磨方式取得数据援手。

  基于观点模子的疏通效率本色是阅读者确切明白模子中讯息的水平,能够界说为阅读者确切驾驭的讯息量与模子整个讯息量的比率。但讯息自身具有差异的种别,近年来琢磨中众依讯息种别将明白效率划分为差异的维度,以深远阐发模子对疏通有用性的影响。如Agarwal等凭据讯息构成分为简陋讯息(仅蕴涵基于机闭的或基于流程的讯息)与繁杂讯息(蕴涵两类型讯息),琢磨察觉开垦职员运用面向流程的观点模子明白繁杂讯息明显优于面向对象的观点模子。而正在简陋讯息明白方面无明显区别。

  明白效率的维度,即讯息种别的划分不存正在团结的圭表,首要依琢磨主意而定,如上述琢磨中的讯息分类是为了寻求讯息机闭与模子机闭的成婚。

  阅读者明白模子中讯息的流程是观点模子与阅读者个体交互的流程,于是分歧受到模子特征及个体特征两方面成分的影响,如图1所示:

  看待模子成分,以往琢磨察觉了少许好的品格,如讯息完美性、真切性等。知足好品格的模子不妨提拔明白效率,如Gemino等通过实证琢磨验证了本体论语义更真切的模子更利于明白。

  个体特征中的成分闭怀较众的如个体体味、学问。体味越足够,学问贮备越充分,个体明白效率肯定越好。如Khatri等的测验室琢磨验证了开垦职员所具有的模子技巧学问以及操纵范围学问对阅读效率的影响用意。

  然而,这些琢磨不妨答复的实际题目很有限。起首,用户具有高的操纵范围学问秤谌及低专业技巧学问和实施体味,现有琢磨对如许的复合成分组合的情状难以证明。其余,除了模子特征中的“好品格”,差异的模子仍旧存正在其他区别影响阅读者明白流程,但用意效率或者一视同仁。如有琢磨察觉相看待面向对象的筑模方式,面向流程的模子更利于开垦专家周到识别讯息,而对开垦新手不存正在如许的区别。于是,本文将凭据用户满堂的认知特征阐发其与观点模子特色的交互相闭。

  观点模子首要的暴露式子是图形,为了更深远剖析用户阅读观点模子时的认知特征,能够鉴戒图形明白的干系外面:感知外面与认知外面。

  感知外面证明了阅读者将所看到的图形讯息放入短期回顾的感知流程,征求三步:辨识图形中各符号对象;凭据模子中符号的空间组织对符号举行分组及确定宗旨相闭;对符号开始结构并放入短期回顾。专业的操练和实施不妨使开垦职员具备结构图形讯息的手腕;而用户未担当过培训,只是根据阅读文本时的习气战术从左向右、自上而下地结构模子讯息,于是放入短期回顾中的讯息根基是根据模子的讯息结构办法。

  认知外面证明了讯息放入短期回顾后的认知流程,征求两个运动:搜求长远回顾中的干系学问;对图形讯息举行证明并与长远回顾整合。影响认知效率的根基成分是认知盘算量。对用户来说,首要依赖搜求长远回顾中闭于营业境况等的学问来证明图形所通报的寄义。凭据认知成婚外面,当放人短期回顾的讯息机闭与用户长远回顾中的学问结构办法一概时。搜求干系学问的服从将普及,整合新学问时也删除告终构相闭的转换盘算,使得总的盘算量低浸,于是认知确切性将普及。

  综上所述,观点模子的讯息结构办法与用户长远回顾中学问机闭的成婚水平是影响认知流程确切性的紧要成分。

  本文将以面向对象与面向流程的观点模子为例,验证上述阐发。两类模子对讯息的结构办法明显差异:面向对象的模子将讯息分类、笼统为对象,以对象为中央结构与对象干系的属性、动作、通信等讯息,如用例图中环绕各脚色的动作运动(即用例);而面向流程的模子将讯息笼统为讯息流,通过讯息收拾流程中的前后连接结构讯息,如数据流程图中“收拾模块”的输入和输出“讯息流”。

  认贴心理学中繁众琢磨结论显示出人们的自然思量办法起首是分类,这恰是面向对象思念的底子。于是能够说,面向对象模子的讯息结构办法与未担当过专业练习的用户脑中的学问结构越发成婚。由此占定,与面向流程的观点模子比拟,采用面向对象的观点模子更利于用户明白。

  假设1:描画统一编制讯息时,用户运用面向对象模子的明白效率明显高于面向流程模子。

  语义搜集外面对人脑中的学问结构办法作了很好的证明:人的长远回顾中,学问是通过节点互联的搜集来结构的。节点代外任何实体、笼统类、属性等观点;节点间的贯穿显露观点间的某种相闭。一条讯息或者蕴涵一个、两个或众个节点,而众个节点之间的相闭或者是直接相闭,或是通过某些节点间接相闭。

  分明,当讯息蕴涵的节点数较少、节点间的贯穿较少时,认知流程的搜求和整合盘算量都更小。于是,为了进一步阐发用户认知特征与观点模子的交互用意,本文凭据讯息中所蕴涵的节点数及贯穿相闭的繁杂水平,将明白效率分为简陋明白与繁杂明白。

  有琢磨曾察觉,不熟识观点模子的阅读者正在运用用例图和运用数据流程图识别单个讯息点的完美性上没有分别。这是由于,明白简陋讯息时的认知盘算量很少,面向对象模子讯息结构的上风不明显;但跟着讯息繁杂度增补,两类模子认知盘算量的区别将流露出来。

  假设2:描画统一编制的简陋讯息时,面向对象与面向流程观点模子的用户疏通效率无明显区别;

  假设3:描画统一编制的繁杂讯息时,面向对象观点模子的用户疏通效率明显高于面向流程模子。

  本文采用测验室琢磨方式收取数据。测验正在大学教室道行,选修统一课程的处分学院各专业学生自觉插足,最终插足学生41人。测验中学生被随机分为两组,顺序告终三项职分:阅读描画统一编制的编制需求解说,两组的阅读质料差异;答复闭于编制明白效率的测试题目,征求简陋讯息及繁杂讯息;填写个体通过以及测验感应的问卷。

  3.2.1测验情境待开垦的编制是一个校友录编制。大学生对如许的编制较为熟识,适合学生行为编制用户的脚色。测验职员正在测验早先时将以编制开垦者的脚色进入,并解说测验插手者将行为该编制的用户,测验主意是运用户明白编制的修建实质。

  3.2.2需求解说两组阅读的需求解说分另0由用例图(Use Case Diagram)与数据流程图(Data Flow Dia-gram)来描画,两者是方今运用最普遍的观点模子,分歧代外貌向对象与面向流程的观点模子。两组模子描画了一致的编制实质,所通报的讯息量一概,只是外达式子差异。因为测验时候的限度,所描画的编制只具备简陋的效力。

  3.2.3明白效率用户的明白效率通过答复题目具体切率来反应。整个题目均为占定题,共14题:闭于简陋明白的题目共7题,只涉及需求中两个观点及直接贯穿相闭;闭于繁杂明白的题目共7题,涉及三个以上观点及其相闭。整个14道题目具体切率反应用户的满堂明白。

  3.2.4测验后侦察问卷问卷首要通过五点量外衡量测验中的假定前提以及驾驭变量。征求三个题目:阅读者对观点模子的练习水平、阅读者对校友录编制布景的熟识水平(这两者用来担保学生行为用户脚色的有用性)以及阅读者感知的模子阅读难度。感知的阅读难度也是影响模子运用的紧要成分,于是正在本琢磨中行为驾驭变量。

  测验采集到数据41份,起首剔除答复不完美的数据1份,然后对测验的条件假定举行搜检。统计阅读者的模子学问评释整个插手者都没有练习过观点模子学问,同时95%的插手者较熟识或分外熟识校友录编制。为进一步担保据验的有用性,凭据插手者对编制布景的熟识情状剔除分析很少或完整不分析的插手者数据3份。最终取得有用数据37份,其顶用例图组19份,数据流程图组18份。接下来将运用SPSS统计软件对数据举行阐发、验证假设。

  采用众元方差阐发方式验证两观点模子组阅读效率的区别,并将用户感知的模子阅读难度行为协变量以驾驭其对因变量的影响。两组用户的简陋明白效率没有明显影响(明显性=0.617),援手了似设2;繁杂明白效率方面,用例组(均值=0.722)明显高于数据流程图组(均值=0.579),明显性=0.007,援手了假设3;总体明白效率方面,用例图组(均值=0.726)也明显(明显性=0.043)高于数据流程图组(均值=0.643),援手了假设1。如外1所示:

  通过对统一用户简陋明白效率与繁杂明白效率的配对均值搜检来反应前文中闭于明白划分的认知底子。用户对简陋题目的明白效率明显高于对繁杂题目的明白(明显性=0.045),如外2所示:

  4.4.1用例图组用户的总体明白效率明显高于数据流程图组(假设1)基于前面的阐发,该结论正在外面上验证了影响用户明白效率的一个紧要的观点模子成分――模子讯息结构机闭特色,该成分与用户学问结构机闭交互影响用户明白效率,即运用与用户学问结构机闭更邻近的观点模子取得的用户明白效率更好。这为观点棋型的采取和评判供应了一个较牢靠的寻常性的按照。该结论为实施中而向对象的观点模子正在用户疏通方面的意旨供应了证据援手,为开垦项目采取观点模子供应了直接的参考。

  本文基于认知特征的阐发以为用户与开垦职员正在明白观点模子时(无论是感知流程如故认知流程)具有明显区别,比照以往琢磨中面向流程的慨念模子更有利于开垦职员明白的结论,本测验室琢磨的结论间接阐明了用户与开垦职员认知特征上的区别。

  用户对简陋题目的明白效率明显高于繁杂题目;且用例图/数据流程图正在简陋和繁杂讯息明白效率方面的显露明显差异(假设2,假设3)。这些结论验证了认知繁杂度是用户明白效率的本色影响成分,进一步证明了具有差异讯息结构特色的观点模子是通过影响用户认知盘算量影响用户明白效率的。

  同时,该结论具有更高的牢靠性。能够对以往少许琢磨结论举行证明:即因为所筑立的讯息过于简陋或没有采取对用户认知盘算量有影响分别的观点模子,以往琢磨或者取得观点模子对用户疏通效率无影响用意的结论。这再次确信了该范围琢磨中以用户认知特征为底子的紧要意旨。

  众媒体讯息编制涉及文字、图形、图像、动画、音频、视频等各样讯息媒体,奇特是漫衍式众媒体编制,其数据机闭的繁杂性、编制效力的众样性、交互竣工的及时性对编制提出了更高、更新的哀求,从而加剧了编制开垦的难度。实证琢磨评释正在编制开垦流程中一半以上的纰谬是由需求的不正确和不完美惹起的,正在开垦的早期阶段的质料担保要比正在终局测试的效益突出33倍众[1]。而观点筑模是普及需求阐发的质料的紧要技巧。琢磨众媒体讯息编制观点筑模方式,看待众媒体讯息编制的开垦、引进、改制、圭表化和集成都具有主动的质料担保用意。

  文献[2-6]从差异角度对观点筑模举行了界说,不难察觉,讯息编制的观点筑模是并不思考编制底层的实在竣工技巧,它从需求的角度外述了编制的首要特色并变成笼统的轮廓。看待众媒体讯息编制而言,观点筑模并不涉及到媒体存储、转换、检索等干系的技巧题目,但需思考媒体的干系操纵和类型。要正在一个漫衍式众媒体讯息编制中竣工各样众媒体对象的集成、同步、交互和显示,就务必为其筑树一个独立于实际境况的笼统的显露模子。方今,漫衍式众媒体讯息编制观点筑模首要面对如下题目:

  (1)漫衍式编制的异构性。漫衍式众媒体讯息编制的跨平台的特征,涉及差异的盘算机系统机闭、差异的操作编制、差异的搜集允诺圭表和差异的数据库,从而发作各样异构,导致操纵编制开垦的繁杂化。

  (2)海量数据存储和体式的区别性。众媒体数据有别于寻常数据,它集成众种式子的实质,其数据量是海量(MASS DATA),数据量大,且数据体式区别极大,倒霉于讯息编制的结构和存储,增补了数据收拾的难度。

  (3)时空的纷歧概性题目。良众众媒体数据带有时候属性和空间属性,如音频数据、视频数据、图形数据,正在漫衍式众媒体讯息编制中,由各盘算节点的盘算延时、搜集传输延时、节点空间坐标系纷歧概容易形成的时空纷歧概题目,从而影响观点筑模的正确性和符合性。

  观点筑模方式是供应运用观点筑模语法的程式,一般首要规章怎么把对一个范围的阅览结果映照为观点模子[7]。从上世纪70年代起新的观点筑模方式早先激增,据不完整统计,或者有1000众种观点筑模方式,况且每年还正在不休地伸长[8]。文献[9-11]勾结操纵范围对观点筑模方式做了实施性琢磨,从理 论上讲,方今观点筑模方式首要有三种:机闭化观点筑模、面向对象观点筑模、本体观点筑模。

  (1)机闭化观点筑模。即凭据“自顶向下、慢慢细化、模块化策画”的思念,将采用自顶将整体编制效力划分成一系列竣工独筑功能且可互相挪用的模块,用模块机闭相闭来显露编制模子。但其存正在“需求冻结”的隐患,不适合机闭繁杂的漫衍式众媒体讯息编制。

  (2)面向对象观点筑模。运用类、对象、经受和讯息机制举行观点筑模。阐发阶段通过类或对象的认定,确定类之间(或对象间)相闭,然后对它们的属性、所供应的方式和所需求的方式举行描画,并根据它们之间的相闭举行结构,取得类(或对象)机闭。面向对象观点筑模,即是要将类和对象映照为观点,只消寻找类和对象并筑树了类机闭,也就筑树了观点模子[12]。面向对象筑模单个对象显露的动作粒渡过于细密,难以左右题目的本质和总体机闭,容易形成编制机闭分歧理及各个人相闭失调等题目。

  (3)本体观点筑模。通过对静态的范围本体和动态的职分本体两个个人举行阐发描画,并勾结用户需求阐发,取得语义层面上的观点模子;借助本体描画叙话及筑模用具将观点化的实体与流程图形化外达,变成实在的效力模子 [13]。本体行为共享观点式子化筑模用具,可加强编制模子的语义外达才干,以便更好的取消语义区别,竣工差异编制间的学问共享和互操作,是另日筑模技巧的进展宗旨和趋向[14]。

  通过上述先容,能够察觉几种观点筑模方式旗鼓相当,下面笔者以漫衍式众媒体搜集教学编制中课程实例为例,扼要解说面向对象观点筑模念筑模方式与本体观点筑模方式的实在操纵。

  UML是邦际对象处分结构OMG拟订的可视化筑模叙话圭表,首要用于面向对象筑模,UML的重心是以面向对象思念来描画客观宇宙,即通过类图、修建图、计划图等显露编制静态机闭的静态模子和对象图、用例图、依次图、合作图、状体图、运动等显露编制动态机闭的动态模子来描画编制的及其内正在的干系。此中,UML类图是面向对象观点筑模的重心,看待编制的重心观点,用类、属性和方式显露,观点间的相闭首要采用蚁合、组合、泛化(经受)以及依赖、相闭等相闭来外达。

  基于UML的观点筑模,首要用于编制需求与阐发阶段人与人之间的疏通换取,它只对题目域的对象(实际宇宙的观点)筑模,而不思考界说编制中技巧细节的类(如收拾用户机闭、数据库、通讯和并行性等题目的类),从这一点上来讲,漫衍式众媒体讯息编制比拟适合采用基于UML的面向对象观点筑模。同时,UML团结了Booch、OMT和其他面向对象方式的根基观点和符号,密集了面向对象范围中的众种思念,为观点模子的外达供应了科学的、通用的、圭表化图形符号显露,并能被交互的可视化筑模用具所援手,使得范围内的编制干系者都能够通过观点模子分析干系观点。此外,UML征求观点的语义、显露法息争说,供应了静态、动态、编制境况及结构机闭的模子。图1为搜集教学编制顶用类图显露的用户(User)观点模子。

  正在讯息编制范围,本体的重心是描画范围的本色观点及其之间的相闭,是范围共享观点模子的式子化范例解说[15]。本体外达的观点间相闭一般征求个人相闭、所属相闭、实例相闭、属性相闭。比拟本体与UML类图,能够看出:本体中的类或观点相当于UML中的类,以及类的属性和方式;本体中的根基语义相闭能够与UML类图中的相闭相对应,好比,个人相闭能够对应类图中的蚁合或者组合相闭,所属相闭对应类图中的泛化(经受)相闭,实例相闭能够对应UML中的类与对象的相闭,属性相闭本质上对应一个类图中类与其自身属性的所属相闭[16]。将图1中的类图转换为本体模子如下:

  至于本体观点筑模的竣工,寻常采用OWL(Web Ontology Language)圭表描画叙话告终。OWL本体征求类、属性和它们的实例(即个别)的描画,通过采用OWL对繁杂的跨平台、异构性的漫衍式众媒体讯息编制编制观点模子及其之间的干系举行式子化描画,使得编制观点模子外达为语义和语法正确范例的范围本体,不妨被盘算机自愿识别收拾,正在统一范围差异讯息编制之间共享学问,从而有用担保漫衍式众媒体讯息编制的最终质料。实在竣工可参考其他干系文献[18-19]。

  讯息编制筑模,本质上是对讯息编制举行剖析、描画、阐发并笼统显露的流程。看待繁杂的漫衍式众媒体讯息编制,怎么归纳量度各样观点筑模方式利弊,“择其善者而从之,其不善者而改之”,直接影响了另日编制质料。本文勾结UML类图对面向对象观点筑模和本体观点筑模做了实在的实证阐发,下一步笔者将勾结OWL叙话针对漫衍式众媒体讯息编制筑模做进一

  [3] 孙凡.讯息编制观点筑模方式绩效评判的琢磨[J].盘算机编制操纵,2009,(4):15-17.

  [9] 贾美英,杨炳儒,张文海,等.谍报讯息编制观点模子筑模方式琢磨[J].谍报琢磨,2009,53(22):35-39.

  [10] 谢春燕,李为民.区域反导组网作战策略讯息分发编制军事观点筑模琢磨[J]. 军事运筹与编制工程,2005,19(3):34-35.

  [11] 华玉光,徐浩军,刘凌,等.军事系统顽抗繁杂编制观点筑模方式[J].编制仿线] 徐宝祥,刘爽. OOA正在讯息编制中观点筑模方式[J].谍报科学,2001,19(1):66-68.

  [17] 冉婕,,昌霞,等基于OWL的谚语典故本体修建琢磨[J].盘算机技巧与进展,2010,20(5): 63-64.

  跟着Internet讯息资源以指数递增,现有的搜求引擎已越来越难以知足人们高质料地获取搜集讯息的需求,奇特是搜集教训境况下的用户,其练习动作及风趣根基上正在本学科范围之内,常用的守旧搜求引擎不行修正确、实时、巨子地检索出他们所需求的讯息.现有搜求引擎的控制性显露正在:(1) 基于简陋的闭头词或盘查前提成婚,往往输出大批的文档,而真正与用户讯息需求干系的文本却很少;(2) 对盘查结果的排序算法首要按照闭头词的词频、地点、附近度以及更新日期等目标,这种基于闭头词的需求模子不行周到反应用户的风趣趋势.

  [1]面向搜集教训讯息资源境况下的用户,提出修建天性化智能搜求引擎的少许新见识和新方式,如学科范围语义搜集、风趣过滤模板和天性化智能风趣等.策画天性化智能搜求引擎,樊篱与用户需求不干系的讯息,并助助用户凭据个体风趣类型和学科专业讯息需求,自愿正在Internet上查找所需的讯息,供应真正意旨上“所得即所需”的天性化搜集讯息任事.

  近年来,呈现很众知足用户天性化讯息需求的技巧,如笔直搜求引擎、要旨网站、数据推送技巧、流程跟踪技巧、智能搜求和协同过滤等.此中,智能搜求技巧[2]治服守旧搜求引擎的缺陷,通过搜集讯息发现技巧提取用户的风趣,然后凭据用户的风趣过滤搜求引擎所返回的结果,使得搜求结果能够极大地知足用户的天性化需求.目前它曾经成为Web搜集讯息检索的重心技巧.与守旧的搜求引擎比拟,其特点首要显露正在:(1) 讯息采集和收拾智能化.选用有用搜求战术,按必然语法轨则智能地、有采取地自愿采集搜集讯息,使用推理机制和练习机制,对采集来的搜集讯息智能收拾和明白.(2) 讯息检索智能化.采用自然叙话检索入口,答应用户自正在外达盘查哀告.(3) 讯息检索天性化[3].诈欺数据发现技巧对用户访候的史册讯息举行风趣轨则抽取,以此预测用户异日的动作,并凭据用户的评判和反应调剂我方的动作.

  编制首要从“讯息检索模块”和“天性化智能风趣”这两个方面举行智能化琢磨.首要策画思念为:正在全文检索的底子上,使用“观点语义网”修建“学科范围语义搜集”,竣工观点的扩展检索,以普及编制的查全率;再通过“网页过滤器”和“天性化智能风趣”,筑构学生的个体风趣模子,过滤出学生所需求的讯息资源,以普及编制的查准率.

  2.2 编制机闭编制首要分为5个构成个人(睹图1):讯息检索模块,搜求Robot,网页过滤器,风趣索引数据库和天性化智能风趣.

  (1) 讯息检索模块 举行盘查子句的分词收拾后提取闭头词,采用“观点树”机闭,竣工闭头词正在观点方面的检索,将目前基于“词”的检索普及到“观点”宗旨;

  (2) 搜求Robot 根据必然的战术正在Internet搜集教训资源中抓取网页,并将网页交给网页过滤器;

  (3) 网页过滤器 凭据用户提交的“范围词”(风趣要旨闭头词)筑树网页过滤模板template,逐日众次挪用Robot获取过滤讯息源举行过滤,寻找用户感风趣的网页,并将网页交给风趣索引数据库举行存储;

  (4) 风趣索引数据库 采用全文检索技巧,对搜求来的网页实质举行基于“词”的索引,再对应观点语义网中所呈现的“范围词”,用“词频法”盘算范围词正在网页中呈现的频率,以显露该范围词与网页的干系度,结果根据词频巨细举行排序,并变成倒排文档,存储正在风趣索引数据库中;

  (5) 天性化智能风趣 通过对学生检索结果的天性化讯息提取,筑构学生的天性化风趣模子,并对模子举行保卫和更新,竣工为学生供应天性化任事的方向.

  讯息检索模块基于观点语义搜集竣工.“语义搜集”是学问的一种图解显露,“观点语义搜集”由节点(观点)和弧线或链线(节点之间的相闭)构成.此中,观点(Concept)通过字、词和词组等描画元素外达.观点语义搜集[4]的修建需求具有必然范围的学问行为底子,况且学问外达要正确、真切,满堂机闭宗旨要完美并具有较高的坚固性,正在较长时候内不行爆发转变.正在搜集教训境况中,用户学科范围学问的分类相对坚固且正确,运用范围学问显露用户的某种练习风趣偏好完整可行,睹图2.

  这里,编制通过修建“学科范围语义搜集”提取用户风趣特色,然后筑树用户的风趣模板template过滤网页讯息,告终对用户练习风趣的定制.为了能尽速逼近用户的本质风趣,正在编制注册时也能够通过分类列外让用户自觉采取感风趣的学科范围或琢磨宗旨,记载正在用户Profile文献中.

  (1) 用“观点树”的方式筑树观点之间的上基层相闭.上层观点是其整个基层观点联合属性的归类,基层观点则是从差异角度对其上层观点的细化.最上层Ω是虚拟层,使整体观点树变成一个满堂.用户对观点节点的访候频率呈现出用户对该观点实质的风趣.

  这里,每个观点节点都能够按学科分类代码(1992年邦度宣布的《中华百姓共和邦粹科分类与代码邦度圭表》)为底子举行观点编码标记,而且每个观点都带有一个蚁合,由该观点的同义但差异描画元素构成,好比:Φ(盘算机软件)={软件,顺序,software}.蚁合能够凭据同义词辞书或本质需求举行增添、删除、删改等操作,如许收拾还能够漠视观点的语种区别,对文档中存正在的中英文互用举行识别,将这些讯息存入观点库(Concept Base)中.观点标记可显露如下:

  (2) 每个观点可与其他观点筑树相应的相闭.该相闭差异于分类中上基层相闭的横向相闭,可采用差异的弧线来外达观点之间的差异相闭.3.1.2 观点扩展检索

  正在编制“分词辞书”中供应一个主辞书、同义词辞书及蕴涵词辞书.学生输入盘查哀告后,由“分词辞书”举行分词后提取范围词,并凭据观点语义网赋以相应的观点编码标注,检索模块对观点举行扩展.实在而言,它竣工观点宗旨上的同义扩展检索、观点拓展检索和干系联念效力.

  网页过滤器是整体编制的紧要构成个人.针对某一网页实在过滤流程如下:凭据用户学科范围语义搜集中的“范围词”筑树网页过滤模板(用户风趣模板),过滤模板template向量显露为

  增添到风趣索引数据库中.这里,过滤阈值θ具体定极端贫穷,外面上尚没有很好的处置方式.阈值设定过高或过低,城市影响编制查全率或检准率;而用户的风趣差异,过滤阈值也会有所差异.这里阈值的设定能够参拍照应的用户风趣示例网页集确定.[5]

  因为编制面向的是搜集教训境况中的学生,而这些学生的练习动作根基上正在本学科之内,其风趣鸿沟较Internet上的普及用户要坚固,于是能够正在语义搜集上局面地修建学生个体风趣搜集.正在观点语义搜集的底子上,编制通过学生对检索结果的反应讯息,逐步筑树起各观点节点的横向干系,采用对学生的学科子树上的各节点及节点之间的相闭举行品级盘算,取得学生风趣点的观点和相闭品级排序.即编制不只能够取得学生感风趣的闭头词,还能取得学生所感风趣的一组互相相闭联的风趣词,以此确定学生的风趣趋势.智能风趣运转正在编制的盘查接口模块中,学生提出盘查哀告后,讯息检索模块通过检索对观点举行扩展,然后智能风趣再凭据学生的个体风趣模子提取学生感风趣的讯息,并将检索结果暴露给学生.

  本编制的首要特征如下:(1) 自愿过滤用户不干系文档,以普及检索精度和服从;(2) 将目前基于词的检索普及到观点宗旨,竣工闭头词正在观点方面的检索;(3) 正在全文检索的底子上,使用观点语义搜集竣工观点宗旨上的同义扩展检索、观点拓展检索和干系联念,普及编制的查全率;(4) 通过天性化智能风趣筑树学生的个体风趣模子,过滤出学生所需讯息资源,普及编制的查准率,并能急速自适操纵户风趣的转变和境况的转变.5

  将智能搜求技巧操纵于搜集教训讯息检索的天性化任事,是一个极具挑衅性的琢磨宗旨,其琢磨实质属于目前智能讯息检索范围的紧要课题,具有很强的外面意旨和实际意旨.但因为认知范围的繁杂性和个别练习的区别性,练习流程中有良众成分影响天性化搜集教训讯息检索的竣工,编制中还面对着很众有待以后琢磨处置的题目.如过滤阈值θ的合理确定、过滤的速率和精度等.固然该智能搜求引擎能通过观点网对盘查范围词举行观点扩展,但也只是正在盘查语句分词、提取范围词的底子长进行扩展,永远不行完整明白学生的盘查哀告,更加不行明白学生盘查语句的语法机闭,该当正在句法的明白长进行进一步的琢磨.

  [1] 饶增阳. 搜集境况下的天性化讯息任事[J]. 谍报探寻, 2004(3): 3-4.

  [4] 黄曾阳. HNC(观点宗旨搜集)外面[M] 北京: 清华大学出书社, 1998.

  近来几年来,为了使人们不妨按实质的语义外达需求,疾速正确地从成千上万的网页中过滤出我方感风趣的实质,把本体普遍操纵于各个讯息范围中,同时曾经成为目前讯息科学琢磨的一个热门和难点,备受宇宙良众邦度的侧重。正在讯息检索和抽取[1]等范围中,本体外现着越来越弗成欠缺的用意。讯息抽取是把文本里蕴涵的讯息举行机闭化收拾,形成外格一律的结构式子。输入讯息抽取编制的是原始文本,输出的是固定体式的讯息点。讯息点从各样各样的文档中被抽取出来,然后以团结的式子集成正在沿途。这即是讯息抽取的首要职分。基于范围本体的讯息抽取编制,能够竣工让用户取得具有天性化的讯息任事,同时通过范围本体为讯息源供应相应的语义标注,如许可使编制对本范围内的观点以及观点之间的干系有团结高度的剖析,从而正在必然水平上普及讯息任事的查准率和召回率,竣工为用户更有针对的讯息任事。

  1.1 本体的根基观点本体论(ontology)是一个玄学上的观点,是指玄学中琢磨宇宙的来源或个性的个人。不少玄学家把本体论看作是西方守旧玄学思念(从柏拉图到黑格尔)的主干或”第一玄学”。从本体论的根基观点启航,玄学上把本体论界说为”对宇宙上客观事物所举行的编制描画”。

  1.2 范围本体的观点范围本体(Domain ontology)是用于描画指定范围学问的一种特意本体,它给出了范围实体观点及互相相闭范围运动以及该范围所具有的性格和法则的一种式子化描画[2]。

  1.3 范围本体[3]正在讯息抽取中的操纵基于范围本体讯息抽取是新型的讯息抽取办法,它诈欺范围本体而不是扁平机闭的辞典与词外来识别抽取讯息,范围本体讯息抽取能够正在语义层而明白抽取讯息,同时能够通过范围本体实例对抽取讯息实质举行语义标注,从而普及了讯息抽取的查准率和召回率。

  1.4 讯息抽取检索编制中范围本体的修建学问工程中的本体是人工策画的闭于某个范围的观点模子的一种显露。目前己有的本体良众,出于对各自题目域和实在工程的思考,构制本体的流程也是各纷歧致的。因为没有一个圭表的本体构制方式,不少琢磨职员出于诱导人们构制本体的主意,从实施启航,提出了不少有益于构制本体的圭表。

  2.1 范围本体的策画法则通过阐发总结,本体的策画法则能够详尽如下[4]:①昭彰性和客观性:即本体该当用自然叙话对所界说术语给出昭彰的、客观的语义界说。②完整性:即所给出的界说是完美的,完整能外达所描画术语的寄义。③一概性:即由术语得出的推论与术语自身寄义是相容的,不会发作抵触。④最大贫乏可扩展性:即向本体中增添通用或专用的术语时,不需求删改其己有的实质。⑤最小应允:即看待筑模对象给出尽或者少的束缚。⑥最小编码偏向:本体的筑树应尽或者独立于实在的编码叙话。⑦运用众样的观点宗旨机闭竣工众经受机制。⑧尽或者运用圭表化的术语名称。

  2.2 范围本体的修建环节正在本质的修建流程中,凭据题目范围和实在工程的差异,变成众种修建本体的方式。目前,学问工程界比拟成型的筑模方式首要有:如骨架法[5]、企业筑模法[6]等。参照这些修建范围本体的方式,勾结讯息抽取中的实在情状,并参考软件工程中的某些思念,范围本体的修建环节如下所示。

  实在如下:①确定范围本体的鸿沟:昭彰修建的本体将笼盖的专业范围、应将本体的主意、用意以及本体的用户鸿沟。②列出范围中的紧要术语:罗列出本编制念要陈述的或要向用户证明的整个观点。③筑树本体框架:这时需求根据必然的逻辑轨则把它们举行分组,变成差异的劳动范围,正在统一劳动范围的观点,其干系性该当比拟强。④策画元本体,重用已有的本体,界说范围中观点及观点之间的相闭。⑤对范围本体编码、式子化。⑥范围本体的搜检评判。

  凭据以上闭于范围本体的策画法则和推行环节,本文正在开垦范围讯息抽取原型编制时,首要运用手工和半手工的办法竣工了手机范围本体,正在编制的发售范围中起了很大用意。

  3.1 手机范围本体的框架策画基于范围本体的web页面讯息抽取首要是诈欺自身的描画讯息举行抽取,于是对网页机闭的依赖较少。采用这种方式举行讯息抽取,预先需手段域专家采用手工办法书写某一操纵范围的本体(此中征求对象的常值、闭头字的描画讯息)。凭据范围本体的观点、观点属性以及属性之间的相闭需求筑树相应的相闭数据库。然后凭据本体中常值和闭头字的描画讯息发作抽取轨则。对每个无机闭的文本块举行抽取取得各语义项的值,结果将抽取出的方向讯息放入凭据范围本体的描画讯息天生的数据库中。那么,下面临比拟紧要的数据外及其用意举行各个解说如下。

  ①实体观点数据外用于生存手机范围中可精明系的实体观点。方才筑成时,能够通过人工查找、识别出范围实体的少许观点,并生存到数据库中。正在此自此,可通过盘算机辩别出范围实体观点,并把它追加到数据库中手工举行搜检。②实体观点特色词数据外,该外存储每个实体观点正在文本中又或者呈现的近义式子或术语。比方实体观点“手机”而言,正在文档中有或者形成为“老大大”、“手提”、“mobile”、“mobilephone”。③属性观点数据外用于存储手机范围中或者存正在的属性观点。该外首要用于生存属性观点中正在确切文本中有或者呈现的近义术语或式子。④属性值观点数据外用于生存范围中或者的属性值观点。该外首要用于生存每个属性值观点正在文本中呈现的术语或式子。⑤观点相闭外首要描画手机范围的实体观点之间存正在的各式相闭。

  3.2 范围本体中观点间相闭的竣工手机范围本体中观点间的相闭的显露通过几个观点相闭外和各数据外之间的相闭来竣工。该范围本体由众个数据外构成,它们不只描画该范围的实体观点、属性观点、属性值和相对应的特色词,况且对实体观点之间的相闭、实体观点、属性、属性值之间的相闭举行描画。而实体观点相闭外描画的是实体观点外中的两个实体观点之间的相闭。实体观点、属性、属性值相闭外描画的是实体观点、属性、属性值之间的互相相闭,如外1所示。

  3.3 手机范围本体的实在操纵本文的讯息抽取原型编制的定名实体识别、实体相闭抽取和职分抽取3个抽取职分,对显示器范围本体都有大批的操纵,首要召集正在如下几方面。

  ①定名实体是文本中根基的讯息元素,是确切明白文本的底子。定名实体识别即是要占定一个文本串是否代外一个定名实体,并确定它的种别,即察觉定名实体和标注定名实体。正在定名实体识别阶段,范围本体能够供应很众语义讯息。诈欺这些语义讯息对本体中的实例举行实体和相闭的抽取有分外紧要的意旨。基于范围本体的抽取检索编制能够诈欺本体中的实例举行实体和相闭的抽取,并不试图使用轨则来察觉新实例,错误学问库举行足够,其方向是抽取的精准率和服从。②讯息抽取编制根基上首要采用机械练习算法来竣工抽取职分,其方向是最大水平地竣工相闭的抽取。它竣工的闭头是算法正在相闭识别职分中具体切率和效率,适合操纵于精粒度的讯息抽取。③讯息抽取编制根基上都是基于形式成婚的,即起首从文本中练习失事故抽取形式,然后再用抽取形式去察觉新的事故。而范围本体的语义讯息不妨用于抽取形式的获取流程事故抽取形式的自扩展流程,不妨对已有的抽取形式举行语义扩展。④其余,正在举行文本或某些网页的段落中的少许紧要观点提取时,范围本体起了分外紧要的用意。

  [2]张志刚.范围本体修建方式的琢磨与操纵[D].大连:大连海事大学,2008.

  [4]郭嘉琦.范围本体的修建及其正在讯息检索中的操纵琢磨[D].北京:北京邮电大学,2007.

  摘要:作品正在阐发财政陈述附注中众维外格的微观形式的底子上,对其举行了式子化描画,提出了元组形式中财政讯息元素是修建XBRL财政陈述分类圭表的最根基单位,维度形式中外、轴成员和项目观点等机闭讯息元素是修建XBRL财政陈述分类圭表的最根基单位,由轴成员和项目观点讯息元素构制了影子财政讯息元素,对XBRL财政讯息元素外面举行了细分和扩展。

  自美邦注册司帐师查尔斯霍夫曼Hoffman等(1999)开创性的将有足够语义外达才干的XML技巧操纵于财政陈述,并逐步变成了可扩展的贸易陈述叙话(eXtensible Business Reporting Language,XBRL)的观点以还,XBRL正在环球鸿沟内实施和进展曾经通过了十五载。

  正在XBRL财政讯息元素外面(张天西 (2006))的琢磨中,“财政讯息元素是修建XBRL财政陈述分类圭表(以下简称XBRL-FRT)的根基单位”已成为很众琢磨者的共鸣(杨周南and 赵秀云,2004;Graning等,2011;张天西等,2011;Kim等,2012;Vasarhelyi等,2012)。看待体式固定的财政报外类讯息具体云云,然而财政陈述的附注中还存正在大批体式可变的众维外格,它们也是以财政讯息元素为修建XBRL-FRT的根基单位吗?

  目前,财政陈述附注中众维外格的构制形式能够分为元组形式和维度形式。本文正在深远理解众维外格差异微观形式的底子上,对两者举行了式子化描画,提出了正在构制众维外格讯息时,元组形式中财政讯息元素是修建XBRL-FRT的最根基单位;维度形式中外讯息元素、轴成员讯息元素和项目观点讯息元素是修建XBRL-FRT的最根基单位;由轴成员和项目观点讯息元素构制了影子财政讯息元素。对现有的XBRL财政讯息元素外面举行了细分和扩展。

  元组(tuple)是一种组合讯息的筑模技巧,此中既能够界说财政讯息元素,也能够嵌套界说其他元组,看待采用元组技巧筑模财政陈述附注中的众维外格的办法,可称其为元组形式。财政讯息元素是元组形式中修建XBRL-FRT的最根基单位。正在外达数据外格讯息时,元组形式直接界说和援用了财政讯息元素的标签、源泉、外达和盘算等相闭,组成XBRL-FRT的模块。中邦采用元组形式的XBRL-FRT有:上交所拟订的“上市公司讯息披露分类圭表”、“金融业上市公司讯息披露分类圭表”、“基金公司讯息披露分类圭表”、深交所拟订的“上市公司讯息披露分类圭表”和证监会拟订的“证券投资基金讯息披露分类圭表”等。以上交所拟订的“上市公司讯息披露分类圭表”外达财政陈述附注中的钱币资金明细外为例,钱币资金明细外元组中直接界说的财政讯息元素有:钱币资金外币币种、钱币资金外币金额、钱币资金外币汇率和钱币资金外币折合百姓币金额等。通过阐发钱币资金明细的XBRL语法的界说,能够得出钱币资金明细的语义宗旨机闭图如图1。

  图1能够看出,元组形式下,财政讯息元素是组成财政陈述附注解细外讯息的最根基单位,财政陈述附注中的众维外格由财政讯息元素蚁合直接构制而成,企业通过直接界说新的财政讯息元原来扩展财政陈述附注的众维外格。

  由轴和项目构制的维度也能够筑模财政陈述附注中的众维外格,可称其为维度形式。维度(Dimension)是由轴、成员、项目、观点和事项等原子观点构制而成(Hoffman,2012),此中:外由行(轴)和列(项目)组成,用于构制外格类事项讯息,用Table显露,外中的轴能够是一维也能够是众维,可是项目只可是一维的;轴描画了财政陈述中经济事项的特色,用Axis显露,成员是轴的或者取值,用member显露;项目描画了财政陈述中经济事项的观点,用Line items显露,观点是项主意或者取值,用concept显露;事项界说了财政陈述中可观测的和可陈述的讯息片断,用fact显露。

  维度形式基于众维外格的微观机闭特色,将外格类讯息拆分成轴成员(行)和项目观点(列),其所外达的讯息内在由轴成员和项目观点联合定夺,即:通过维度的行蚁合成员和列蚁合成员的笛卡尔乘积间接构制了财政讯息元素,该财政讯息元素并未正在XBRL-FRT中直接界说,而是通过轴成员和项目观点的界说构制而成。为了与直接界说的财政讯息元素相区别,能够将该形式下变成的财政讯息元素称为为影子财政讯息元素。中邦采用维度形式的XBRL-FRT有:“通用分类圭表”;“石油和自然气行业扩展分类圭表”和银监会“银行拘押报外 XBRL 扩展分类圭表”等。

  众个行蚁合和一个列蚁合的组合筑模能够构制一个n*1型维度。最简陋的情状下,一个行蚁合和一个列蚁合的组合筑模能够构制一个1*1型维度。以通用分类圭表①金融用具列报模块(CAS 37)中的钱币资金年头期末余额外格(参睹外1)讯息为例,该外格讯息采用了2*1型维度筑模办法构制(参睹图2)。

  该维度形式的第一个轴元素蚁合反应了钱币资金种别,此中蕴涵了三个成员:库存现金、银行存款和其他钱币资金;第二轴元素蚁合反应了钱币品种,此中蕴涵了三个成员:百姓币、美元和欧元;独一的观点元素蚁合中蕴涵了三个成员:原币金额、折算汇率和百姓币金额。通过对上述两个轴元素蚁合成员和一个观点元素蚁合成员举行笛卡尔乘积,能够得出该2*1型维度能够构制出27个影子财政讯息元素【3*3*3】。比方,能够用它来构制库存现金美元原币金额、银行存款欧元折算汇率和其他钱币资金美元百姓币金额等影子财政讯息元素。

  图2能够看出,维度形式下,外、轴成员和项目观点讯息元素是组成财政陈述附注解细外讯息的最根基单位,维度中的影子财政讯息元素由轴成员讯息元素蚁合和项目观点元素蚁合间接构制而成。企业通过扩展轴成员和项目观点中的讯息元原来间接界说新的财政讯息元素,变成了对财政陈述附注解细讯息的扩展。

  黄长胤 (2012)通过蚁合论的方式对财政讯息元素南宫28官方网站、实例的财政讯息元素空间和分类圭表的财政讯息元素空间举行了式子化外达。即:分类圭表的财政讯息元素空间能够式子化为:

  式中:j用来指定某个陈述主体的财政陈述中某个实在的列报项目,j∈J,J是列报项目蚁合。该式子化没有对财政陈述中的讯息元素举行细分,通过上节对财政陈述附注微观机闭的解析可知,构制财政陈述附注众维外格的形式有元组和维度之分。咱们将财政讯息元素外面做如下扩展。

  讯息的观点成了“鸡肋”,题目如故出正在教员们不了解若何本领让学生弄理睬“讯息是什么”。若是真的把“讯息的观点”算作纯粹的观点课、外面课来上,效率生怕不会好。先不说对高中学生来说,讯息观点中那显然的玄学味儿能否被明白,即是学生能明白,咱们还需反问我方,咱们真的搞大白“讯息是什么”了吗?

  宇宙上的事宜往往即是如许,咱们越熟识的,越密弗成分的事物,反而越难以说大白,越难下个界说,硬要给出个界说的话,没准越弄越糊涂。讯息即是如许一个东西,它无处不正在,充满正在咱们四周,却又看不睹摸不着。“讯息是什么”这个题目就坊镳“人是什么”、“道理是什么”、“学问是什么”这类题目,看似简陋,实则否则。有人管这一类“是什么”的题目叫“苏格拉底式”题目,对这类题目,不要认为咱们看了书上的界说就能真正弄懂了,堆砌名词对更众处正在感性剖析阶段的高中生而言毫无心旨。

  若是直接从讯息的界说入手,犹如教材中为咱们陈设的名家界说都有些貌同实异,细细品尝这些界说,并没有让咱们从中增补众少对讯息的明白。传闻讯息科学家、玄学家们曾经给讯息下了200众个界说,就拿咱们最熟识的三大界说来说:香农把讯息界说为“用来取消不确定性的东西”,一看便知,香农争论的讯息是通讯编制中的讯息。这个流程中讯息乃至能够用信号、波形来测度,“取消不确定性的东西”是完整能够胸怀的。但香农界说也仅限于此,当“讯息论”如日中天之时,香农自己就众次警戒众人:“讯息论确信不是全能药,它是一个正经的数学分支,分歧用于那些统计道理不行创设的形势。”实际宇宙中的很众讯息题目就不行归结为数常识题,坊镳咱们不行把粮食界说为“取消了的饥饿状况”,讯息也不行简陋地描画成“取消了的不确定性”。我邦有名学者钟义信则把讯息界说为“事物运动的状况和办法”,这个笼统的界说并没有告诉咱们讯息真相是什么,由于事物运动的状况有良众,而简直任何地步都是事物运动办法的反应。结果,咱们不得不搬出维纳的界说:“讯息即是讯息,不是物质也不是能量。”这等于爽性放弃给讯息下一个界说了。

  既然直接从讯息界说入手常常碰钉子,不少教员就绕个圈子,从讯息的特色入手,通过对讯息特色的分析,试图间接搞理睬“讯息是什么”。这内中最紧要的特色即是讯息的依靠性,也即是斟酌讯息与载体的相闭。由于讯息务必依靠载体而存正在,不存正在与载体无闭的“裸讯息”,若是咱们能琢磨大白讯息与载体的相闭,就能左右讯息的本色了。然则正在某些情状下,咱们乃至对“讯息务必依靠载体而存正在”这一铁律都能够提出疑难。好比,咱们正在存在中会遭遇的一种景遇,家里有人正在外埠打工,他有时分会给家里打电话,更众的时分家人得不到他的讯息。当他没有打电话给家人的时分,家人会明白为他正在外埠安然无恙,这正如一句俚语所说的“没有讯息即是好讯息”。但这个例子却给咱们争论的讯息和载体的题目带来了繁难,这等于说家人取得的安然无恙的讯息来自于一个“没有的讯息”,因为没有讯息,当然不需求任何载体,那么讯息还务必依靠载体而存正在吗?

  原本,试图界说“讯息是什么”越来越被以为没蓄志义,早期那种找寻大一统的讯息界说的做法正逐步被放弃。由于几十年来的琢磨评释,盼望某一个简单的讯息观点不妨被公众半人惬心的承认,简直是徒劳的。

  跟着Web2.0技巧的进展,企业运作日益向Inter-net扩展,企业Web讯息的容量和众样性呈爆炸式伸长,Web讯息日益成为企业计划的紧要按照。因为Web讯息具有半机闭化和非机闭化的特色,Web讯息的快速伸长正在为人们获取所需讯息和学问带来更众机缘的同时也带来了更大的挑衅。守旧搜求引擎的功能已到达极限,其基于闭头词成婚排序来检索Web讯息的劳动道理存正在检索结果讯息冗余和不精准的题目,无法知足用户基于要旨盘查的需求,更无法符合企业计划的需求。讯息交融鉴戒人脑的劳动道理,诈欺盘算机对具有相仿或差异特色的众源数据和讯息举行收拾,为用户供应团结的讯息视图和可归纳诈欺的讯息。讯息交融技巧已正在生物、经济和军事等范围取得普遍操纵。讯息交融技巧为Web讯息收拾供应了新的途径,但其琢磨效果首要针对机闭化数据。

  现有Web讯息交融琢磨首要召集正在众源Web讯息检索交融和众Web文档的学问交融两方面,对应于守旧讯息交融中的数据级交融和特色级交融,不援手讯息的众维度和众粒度盘查与归纳阐发,远远不行知足用户从Web有用获取讯息举行计划的需求。

  讯息检索交融将众个搜求组件的文档结果集视为众源证据,归纳诈欺和声效应、撇取效应和/或黑马效应,基于归纳评分或排序对众源结果召集的文档举行优化组合,为用户供应更高质料的搜求结果。采用的首要方式征求:

  2.1.1基于统计的方式分为评分交融和排序交融两类。评分交融算法凭据各源(即搜求组件)的功能给予其权重,用线性组合盘算呈现正在众源结果集的文档的归纳评分,将归纳评分最高的N个文档返回给用户,如WebFusion算法。基于排序的交融算法对众源结果集按干系度排序后采用轮循的办法从结果集抽取文档返回给用户,如SR交融算法。

  2.1.2基于人工智能的方式首要是诈欺人工神经搜集等人工智能技巧举行文档聚类与形式识别。如文献诈欺人工神经搜集自结构映照(sOM)算法对Web网页举行聚类,识别各样要旨之间的相闭,从而竣工搜求结果的蚁合。

  2.1.3基于统计和人工智能的混淆方式基于统计的方式中文档评分函数的式子,文档的实质、链接和机闭三方面各自的权重,以及各搜求组件的权重对交融结果有很大影响,一般勾结人工智能的方式确定,如文献采用形式识别和引导式练习调剂搜求源权重。

  基于众文本的学问交融将搜求结果召集的众个文档视为众源证据,首要诈欺语义本体和自然叙话收拾技巧阐发众个文档,诈欺基于逻辑的轨则、基于本体的映照与团结取消此中的学问冗余、学问不完美性和学问冲突,为用户供应具有一概性的学问。凭据收拾对象的机闭化水平可分为半机闭化文本的学问交融和非机闭化文本的学问交融。

  2.2.1半机闭化文本的学问交融首要对XML体式的讯息举行交融。如文献采用语义本体技巧修建了面向半机闭化讯息(XML体式)的学问交融模子,文献提出了一种将交融轨则与学问库相勾结的对半机闭化讯息举行交融的方式。

  2.2.2非机闭化文本的学问交融首要对HTML体式和其他文本体式的讯息举行交融。大致可分为两类:一是基于Web的本体练习,从网页练习本体观点及观点间相闭、获取观点属性和填充本体实例;二是众文档的自愿摘要编制,重心题目是摘要旬的抽取与交融。

  这方面的琢磨效果很少。中邦科学院Yu L等人提出头向Web发现的讯息交融用具――Web堆栈,策画了Web堆栈系统机闭和EFML收拾模子,正在讯息的交融上采用中介模子。但作家的争论仅限于Web堆栈的观点模子与劳动机制,没有深远争论实在的讯息交融模子与方式。

  总结邦外里琢磨近况,Web讯息检索交融的琢磨效果相对成熟。因为半机闭化文本竣工形式(Sche-ma)映照相对容易,勾结交融轨则和学问推理能够取得较好的半机闭化文本学问交融效率。较贫穷的吵嘴机闭化文本的学问交融,源由正在于机械明白自然叙话仍有难度,目前的自愿摘要编制会发作较大的讯息牺牲。基于文本的语义标注举行学问交融是处置题目的一种途径。现有Web讯息交融算法根基上都是面向Web盘查策画的,不援手众粒度与众维度盘查,无法知足计划援手的需求。面向要旨的Web讯息交融模子与技巧是亟待琢磨和处置的题目。

  面向计划的讯息交融务必援手讯息的众粒度与众维度盘查和阐发,其闭头底子是众维讯息模子的修建,并通过维度的分类相闭(即对维度持续细分取得新的子维度)反应讯息的众粒度特色。因为Web讯息交融的对象,即Web讯息,具有半机闭化和非机闭化特色,无法直接用于计划援手,其闭头是找到一种有用的方式,凭据计划要旨对干系Web讯息举行交融且交融的结果能按众维讯息模子举行结构,同时正在众维讯息模子的底子上能够进一步举行讯息的众粒度、众维度交融,以知足计划援手的需求。基于上述道理策画的面向要旨的Web讯息交融模子如图1所示:

  征求Web文档本体模子、Web堆栈讯息机闭模子、基于代数的操作叙话三个方面,实在道理如下:

  3.1.1Web文档本体模子筑树Web文档本体元模子,策画征求Web文档本体元模子、Web文档观点层、Web文档属性层(征求概要属性、链接与机闭属性、实质属性和相信属性)、Web文档实例的四层机闭框架模子,为非机闭化讯息向机闭化讯息的转换供应语义范式,并诈欺该本体的元模子机制竣工面向差异要旨的扩充。

  3.1.2Web堆栈讯息机闭模子采用众维讯息模子结构讯息,以本体观点为中央,将本体的属性映照为维度,将本体观点的经受与蕴涵相闭映照为维度的分类相闭,策画Web形式,修建原形外和众个维外的星型机闭。诈欺语义模子到众维讯息模子的映照相闭将Web文档本体实例装载入Web堆栈。

  3.1.3基于代数的操作叙话诈欺语义模子到代数编制的映照将基于语义的盘查转换为面向相闭模子的盘查,策画基于代数的操作叙话和映照算法将基于语义的盘查等操作映照到代数编制的蚁合操作;策画基

  于一阶谓词逻辑的观点和属性束缚,用一阶谓词逻辑的子句归结方式剖断组合束缚的线Web讯息交融效力模子

  该模子为具有反应优化机制的“讯息检索交融――属性级交融――观点级交融――计划级交融”的四级交融效力模子,基于Web堆栈竣工Web讯息的众粒度与众维度交融。其根基劳动道理是:起首诈欺面向要旨的讯息检索交融技巧检索Web网页,诈欺本体练习技巧从Web网页天生本体实例,并装载入Web堆栈;然后凭据用户的盘查阐发需求,正在Web堆栈已有众维度讯息的底子上,进一步诈欺本体观点的众粒度相闭和本体实例的团结消重算法,正在属性层级、观点层级或归纳观点与属性层级竣工讯息的钻取、切片、切块和转动等操作,竣工Web讯息正在属性级、观点级、归纳观点与属性的计划级举行众粒度、众维度交融,以供应知足用户需求的讯息交融结果。

  3.2.1效力模子具有自我优化机制的闭环机闭讯息交融效力模子,界说各级效力竣工的输入输出及各级效力的依赖相闭,具有基于评估反应的自我优化机制,不妨阐发评估反应结果与各级交融参数和交融轨则的相闭,并能凭据评估反应结果竣工交融参数和交融轨则的自愿或半自愿调剂。

  3.2.2首要算法首要征求与效力模子相对应的各级交融算法以及本体实例填充算法。①与效力模子相对应的各级交融算法:正在已有讯息检索交融算法的底子上引入相信评判机制,归纳讯息源相信度、文本相仿度和搜求组件权重三个方面的讯息检索交融算法;基于众文档的一致观点一致属性的属性值合并交融算法;基于本体观点上下位相闭的属性级众粒度交融算法;基于本体属性团结的观点级众粒度交融算法;基于图外面、本体观点团结、本体属性团结和本体实例消重的计划级交融算法。②本体实例填充算法:把每个文档视为本体实例,要点处置本体实例观点和属性的练习题目,此中概要属性如所正在站点、创筑时候等概要讯息通过URL和HTTP反应讯息获取;链接与机闭属性通过文本阐发器阐发获取;相信属性由人工赋初值后基于反应机制调剂;策画基于SOM和宗旨凝固的聚类算法获取实例观点及观点间相闭,策画基于文档模板成婚和句法形式阐发的算法获取实质属性。

  控制用户与交融效力模子层之间基于语义举行交互,其竣工式子是语义浏览器。语义浏览器以图形化的办法显示本体,用户通过对本体举行操作来评释面向要旨的盘查与阐发需求,用户哀告被封装成基于语义的式子后提交给交融效力模子层,交融效力模子层返回盘查阐发结果给用户而且能够让用户追踪到交融的干系原始Web讯息。

  面向装束行业企业要旨,知足装束行业按企业和产物举行归纳阐发计划的需求,修建Web讯息交融原型编制。该编制架构如图2所示:

  首要征求数据中央、交融效力、编制处分、操纵开垦接口和用户接口五个个人,讯息源为Web文档。整体编制基于Tomcat+MySQL+Jena竣工。Web文档模子本体和装束本体采用Protege用具修建并存储正在MySQL数据库中,通过Jena的ARQ盘查引擎采用SPARQL盘查叙话举行盘查;交融轨则的前项和后项以数据外的式子存储正在MySQL数据库中;Web堆栈则采用MySQL数据堆栈引擎InfoBright竣工。Web堆栈形式按照装束本体的“观点――属性”相闭筑树,目前凭据“企业”和“产物”观点筑树了两个原形外,并分歧凭据“企业”观点和“产物”观点的属性筑树了以原形外为中央的维外,竣工了本体实例填充算法和基于观点上下位相闭的众粒度交融算法,用户不妨凭据差异观点和属性粒度竣工交融结果的盘查。按产物分级(装束产物――男装――息闲衬衫)检索的交融结果如图3所示:

  跟着新一轮底子教训课程改动和教训讯息化的不休推动,以讯息化境况下的整合教学为代外的新型教学式子,正日益成为方今教训教学改动的新视点,惹起课改专家与宏伟西席的高度闭怀。

  怎么越过整合理念、技巧以及战术的高门槛,并正在新课程教学实施中,不休开辟改进,竣工有用整合与高效整合,真正惠及各学科的教训教学,鼓动讯息化布景下师生的同步进展,我校正在整合理念、技巧操纵以及资源摆设等方面引进了观点图这一先辈的用具。

  观点图是上世纪60年代美邦康奈儿大学诺瓦克教化等人,凭据奥苏贝尔练习外面提出的一种教学用具和头脑用具。正在西方邦度,观点图正在中小学教学中使用分外广大,有着很好的教学效率。目前跟着筑构主义、认知主义练习外面的进展,更加是以Inspiration为代外的,一批效力健壮的观点图绘制软件的普及与扩展,观点图的时期特色更为显然,正在教训教学范围的使用越发普遍,它不只能够用来评判练习,筑构学问,举行思维风暴,团结换取,鼓动意旨练习,还能够用来举行搜集课程开垦、讯息化教学策画及整合教学课件筑制等,行为诱导师生整合教学的适用性用具化平台的代价日益流露。

  观点图是一种用节点代外观点、连线显露观点间互相相闭的图示方式,是一种全新的教学用具和头脑用具。“以观点图为支架的整合教学”是指以观点图底子外面为诱导,以观点图操纵软件为底子性整合平台,并可竣工与讯息化媒体资源,以及Blog、Moodle等讯息化专家平台众元整合的教学式子。

  首要外面底子是认知主义练习外面和筑构主义练习外面以及讯息技巧和脑科学现论。

  课题组从观点图正在整合教学中的操纵实施启航,通过陈述、演示、呈现、研讨、评优竞赛与搜集研习等运动,勾结自我反思、过错互助与专家引颈等行径琢磨,举行有针对性的培训;并辅助以稽核、鞭策等战术,点面勾结,分层递进,满堂提拔西席使用新颖教训技巧的才干。

  深化观点图的外面琢磨,从教与学两方面梳理观点图与教学的内正在干系,开掘并拓展观点图正在整合教学境况中的效力与操纵办法。按学科分类下设11个二级子课题,通过观点图正在差异砚段与差异砚科中的使用,探寻和变成可推而广之的操纵战术,诱导和优化以观点图为支架的整合教学实施。

  以观点图软件Inspiration为整合教学实施的底子平台,主动探寻这一软件与讯息化教学资源的整合办法,同时要点琢磨观点图Inspiration与Blog、Moodle等讯息化专家平台的有用交融。

  (一)探寻并总结了观点图及其软件Inspiration正在教学中的六大操纵效力

  鉴于观点图绘制软件Inspiration优越的易用性和效力性,课题组正在深远实施的底子上,勾结教与学中的各样类型案例,提出并总结出了观点图及其软件Inspiration正在整合教学中的六大效力:学问可视化的外征效力、高级头脑的进展效力、团结换取的引子效力、鼓动教学的评判效力、一体化的教学策画与课件开垦效力,以及修建搜集课程的策画效力等。

  守旧的观点图一般是用手工绘制的,只消有纸和笔,即可绘出教学需求的各样观点图。跟着课题琢磨的推动,目前手绘观点图已慢慢成为师生常态的头脑用具与研习战术。实施评释:师生共绘观点图不只仅能够鼓动教,况且同样能够有用地鼓动学,它既能够充任教的平台,也能够行为学的用具;既能够筑构学问与头脑途径,也能够同步进展认知与头脑才干。

  以观点图为支架的整合教学实施评释:行为一款集整合技巧、效力、理念与操纵战术为一体的讯息化专家平台,观点图Inspiration软件的扩展与普及,不妨有用鼓动讯息化布景下师生的急速发展,适合教训讯息化摆设与进展的实际需求。

  (二)总结并提出了观点图及其软件Inspiration与课程整合的两大操作战术

  课题组主动地领导西席把眼光投向搜集,要点依托互联网免费性、共享性资源,以及学科软件平台,提拔讯息化资源筑构的针对性和适用性,领导把西席有限的时候放正在资源的合理采取,以及与课程的有用整合的策画上,从而极大地解放了西席的劳动,有力担保了整合教学的质料和效益。

  如生物教学中引入的Flasteethwise,不只能够助助学生通过互动探究剖析牙齿、拼装牙齿,况且还能够实习怎么确切刷牙等,很趣味味性;如正在数学图形教学中引入的七巧板Java动画资源软件,能够让学生自助采取众样化的制型,考试各样拼接手腕,同时还供应涂色美化的效力,学生分外可爱;再如正在物理光的色散教学中引入的Shockwave动画资源,不只能够定性地比照各样色光透过棱镜后的偏折情状,况且还供应了偏折角度的衡量用具,助助学生举行定量琢磨;他们正在添补学生直接体味和存在体验缺乏的同时,也足够了教学互动流程,有力支持了新课标各学科的教与学。

  同观点图软件Inspiration一律,博客、魔灯以及少许学科类的教训软件,效力健壮且简陋易学,是实实正在正在的教训讯息化专家平台。可是这些平台往往各具上风与缺乏,众元教训讯息化专家平台整合战术旨正在通过以观点图为支架的众元平台整合,取长补短,添补观点图简单平台正在整合教学中或者存正在的效力缺乏,拓展优化观点图的资源开垦效力、搜集互动效力与课程开垦效力。

  (三)基于Inspiration等讯息化专家平台与课程整合的形式开始变成

  本课题组正在探寻与实施的流程中,并没有一味地胶葛于空泛的理念、战术以及纯粹的技巧培训与灌输,而是独辟门途,通过引入技巧零报复,但又饱涵当今先辈教训理念与战术的观点图Inspiration、博客Blog、摩灯Moodle等讯息化专家平台,助助宏伟一线西席又一次急速凯旋地越过了整合技巧、理念以及战术的“高门槛”。

  Blog具有很好的互动特色,但因为自身技巧的限度,它的页面机闭和暴露办法,则显然失色于Inspiration的显露。鉴于此,课题组正在搜集教学实施中凯旋引入整合战术,竣工了Inspiration和Blog两个零报复专家平台的上风互补。借助于Inspiration与Blog的课外整合,有用突破了时空等成分的限制,竣工了隐性教室显性化,紧闭教室搜集化,静态教室动态化,交互式子众样化,西席同行之间也能够通过搜集课件与Blog举行深度研习和换取反思,有用推动西席搜集教研联合体摆设,鼓动西席隐性学问显性化,最大节制地提拔教室教学的共享度。

  相看待Blog而言,Moodle正在教训教学范围则显得更为专业,效力也更为健壮。不只正在讯息处分方面援手的类型更为足够,况且最为杰出的是,互动式子不再仅仅是简陋的回答,还能够是投票、争论、考查、评判、问卷侦察等,既能够很好地知足搜集教室教学的需求,又能够正在长途搜集教学与处分方面逛刃足够。况且观点图Inspiration与Moodle的整合也有利于调换Moodle课程界面过于线性化、简单化的缺乏,课题组信赖跟着教训讯息化摆设的不断推动,Inspiration 和 Moodle 与搜集教学的整合或者会成为一个新的亮点,值得等待。

  当然跟着整合教学的进展和需求,搜集互动平台也会不完整控制于Blog和Moodle,教学中西席们能够勾结整合的理念加以进展和敷裕,可是就现阶段而言,这两个平台该当是当下以至以后较长一段时候内的搜集互动平台的首选,由于它们既不需求特殊的经费,也没有高难度的技巧培训,可是确效力健壮,分外适合整合教学的实际需求。

  课题琢磨与进展的流程,也即是西席培训与进展的流程,正在启动阶段,课题组首要环绕与观点图相闭的外面专题研习、技巧培训睁开劳动。料理了《观点图参考文献专辑》,涉及邦外里重心期刊发布的数十篇作品,供西席练习参考,有用更新了西席的教训理念,深化了对观点图外面的剖析和明白,学校每学期均结构2次以上的专题练习,有用推动了以观点图为支架的整合教学慢慢走向深远。

  跟着课题琢磨的慢慢深远,差异砚科、差异年级段、差异西席的整合教学早先暴露出很众天性化的亮点,当然也伴跟着呈现了很众题目与疑惑。对此课题组实时展开了以观点图为支架的整合教学呈现研讨、西席论坛,以及外面与技巧的高级培训,对峙扶助与推动相勾结,正在有用分享科研整体聪明的同时,有用化解了新的抵触和疑惑,课题琢磨得以进一步深远和深化。

  正在争论区中暴露了如下的闭于学问检索的先容:①学问检索的根基思念即是模仿扩展人类闭于学问收拾与诈欺的智能动作和剖析头脑方式;②学问检索通过发现其深层寄义,足够精准地外达学问资源和用户需求,进而正在各样异构的数据库、数据堆栈、学问库中举行检索,返回最干系的结果的检索机制;③基于Ontology的学问检索能够论说为:正在范围专家助助下筑树范围Ontology,把采集来的数据按规章体式存储正在相闭数据库、学问库等的元数据库中;④盘查转换器根据Ontology把盘查哀告转换陈规章的体式,从元数据库中成婚出适合前提的数据蚁合,检索的结果历程定制收拾后返回给用户;⑤学问检索的根基特色有:援手自然叙话检索;援手语词、语义实质的收拾,竣工同义词扩展检索和相闭检索;具有观点推理和练习效力;具有健壮人机交互接口。

  学问检索是一种全新的讯息检索办法,是正在现有的讯息检索技巧以及模子上进展而来的。搜求引擎是方今检索讯息的首要办法,它们能正在短时候内反应给用户大批的讯息,但反应讯息中的讯息噪音过大,此中蕴涵了太众的无用讯息;目次分类的数据库范围较小,以至某些要旨下收录的鸿沟不足周到,检索到的讯息数目有限。能够看出,守旧的讯息检索过错正在于没有从语义宗旨上对讯息举行标引,不不妨知足用户正在语义和学问上的需求。而学问检索是归纳使用讯息处分科学、人工智能、认知科学及叙话学等众学科的先辈外面与技巧,基于学问和学问结构,交融学问收拾与众媒体讯息收拾等众种方式与技巧,足够外达和优化用户需求,能高效存取文本、图像、视频、音响等媒体类型的学问源,并能正确精选用户需求的结果。学问检索是将讯息或学问根据必然的办法结构、存储,并凭据用户的需求寻找干系讯息和学问的流程。正在这个流程中,被检索的对象是学问资源、学问库。学问检索即是采用一种从语义上标引作品的技巧,变成学问库,再从学问库中盘查用户所需的讯息。

  学问检索和讯息检索的差异,正在于学问检索夸大了语义,它从作品的语义、观点启航,不妨揭示作品的内正在寄义,而不像讯息检索只是基于字面的刻板成婚。学问检索普及了查全率和查准率,减轻了用户的担任。外1从检索叙话、检索模子、结构办法、搜求办法和检索服从方面举行了归结。

  与要旨词外或分类外差异的是,本体是范围学问范例的笼统和描画,能够构制足够的观点间的语义相闭,不妨正确描画观点寄义以及观点之间的内正在相闭;式子化才干最强,同时具有高度的学问推理才干,能通过逻辑推理获取观点之间的蕴涵相闭。于是,本体是一种学问结构系统。以本体行为学问结构的技巧和方式,能竣工基于语义的学问检索。学问检索是守旧讯息检索的进展,跟着人工智能、编制讯息处分等干系高新技巧的使用,供应天性化、智能化的主动讯息任事也将是学问检索的进展宗旨。方今,图书谍报档案的学问检索编制越发看重文本发现的效力,如大范围实例描画的汉语分词排歧学问库,具有要旨辞书和实质相仿性检索效力,自愿分类、聚类和自愿摘要效力,文本数字明白和新词练习效力等。

  经典的讯息检索模子征求布尔检索模子、向量空间模子和概率检索模子,目前公众半检索编制往往归纳上述各样模子,以到达以为最佳的检索效率。这些检索模子的缺乏是:正在文献的结构与描画上,采用词切分和单汉字或两者勾结标引文献,将闭头词行为描画文献的根基元素,文献之间是互相独立的;正在检索操作上,是基于闭头词的无机闭盘查,难以反应词语问各样语义干系,盘查才干有限,误检率和漏检率很高;正在模子束缚方面,索引项之间独立性的哀求不适合本质情状,盘算盘查和文档之间的相仿度的方式也有控制;虽经不休完好,也难以从根基上符合搜集巨量讯息的检索。

  由此,少许学者从差异角度提出了基于学问的检索模子,如分类检索模子、众维认知检索模子、漫衍式检索模子、观点检索模子等。奇特是观点检索模子治服了以往检索模子中以词及其权值为中央筑树干系性而漠视了语义相闭的过错,以观点辞书为辅助,采用人工智能技巧,加强搜求引擎观点阐发明白才干,从观点层面上来收拾用户的盘查哀告,从而竣工特定范围的观点检索。上述检索模子因为没有学问结构系统的支持,没有竣工对检索对象的语义标注,也没有对其语义举行解析,于是被证明为基于学问的讯息检索模子。

  基于本体的学问检索模子正在资源对象的结构、描画、显露、检索和模子束缚等方面都具有我方的特色,首要显露为:

  正在检索对象的结构上,学问检索模子诈欺范围本体行为结构资源的底子。起首修建一个涵盖干系范围观点及观点间相闭的范围本体库行为资源描画和学问显露的用具与模子,如各学科范围的要旨词外、分类外,正在此底子上确定范围学问本体的首要观点和观点间的各样相闭,修建范围本体的观点模子。

  正在检索对象的描画上,学问检索模子借助语义标引用具,根据范围本体的观点及相闭,对资源对象举行观点阐发、分类、标引、描画和收拾,变成机械能够明白的带有语义讯息的元数据。

  本体观点的优化检索依赖于本体检索叙话的效力。正在援手本体检索的诸如RQL,DQL,0WL-QL,SquishQL,RDFQL,RDFPath和Versa等学问叙话中,以RQL行为学问检索模子的检索叙话能够知足学问检索的需求。

  学问检索模子供应了特定范围可控的观点语义系统,并筑树与观点系统相对应的具有宗旨机闭的自然叙话术语系统,能对自然叙话提问和本体观点库的术语举行语义的明白、阐发和成婚,按照本体观点问的语义相闭,竣工学问检索。

  正在模子束缚上,学问检索模子的束缚比拟少,但哀求观点和相闭组成一个有向图,相闭务必是有宗旨的;此外,哀求每一个观点/实例都需求有一个独一的标识。

  基于上述束缚和所筑树的本体原型,笔者策画了的基于本体的学问检索模子Ont-KRM(Knowledge Retrieval

  Model 0n Ontology)。Ont-KRM分为人机交互个人、学问源个人、检索成婚和本体库等个人,如图1所示:

  人机交互个人首要是阐发用户提交的检索哀告,返回料理检索结果。检索哀告的阐发首要是按照本体学问,阐发用户具体切检索妄念,变成范例、正确的检索哀告,提交给检索成婚模块。检索哀告的阐发首要分为以下环节:①对检索哀告举行预收拾,提取需求检索闭头字(词);②借助本体并正在须要时通过和用户再次交互,占定检索哀告中闭头字(词)的范围、干系观点等等,确定用户具体切妄念;③将用户具体切妄念变成团结、范例的检索哀告提交给检索成婚个人;④正在对用户妄念举行阐发和交互的底子上填充和完好本体库中的干系学问;⑤对检索成婚个人返回的检索结果举行收拾、团结后返回给用户。

  学问源个人首要对学问源举行采集、并对采集的学问源凭据本体库中的学问举行标注和阐发,对从学问源中抽取的学问举行转换,对本体库中的干系个人举行填充和完好,筑树对应的索引讯息,放入索引库。

  检索成婚个人首要是从人机交互个人采集团结的检索哀告,并按照本体库中的干系学问对检索请乞降索引库举行语义与语法层面的成婚,并将检索结果返回给人机交互个人。

  本体库个人该当说是整体模子的重心个人,从对检索请乞降检索结果的收拾,到对检索请乞降索引的成婚,再到对学问源的标注、索引的筑树都基于本体库中的干系学问。同时,上述各个流程又能够对本体库中的学问举行填充和完好。当然,对本体库中学问的任何删改都要历程范围专家和编制的双重认定。

  所谓学问结构系统,是对资源实质观点及其互相相闭举行描画与结构的机制。目前图书谍报界公认的学问结构系统是要旨词外和分类外,但本体是范围学问范例的笼统和描画,能够构制足够的观点间的语义相闭,不妨正确描画观点寄义以及观点之间的内正在相闭。本体是一种学问结构系统,以本体行为学问结构的方式,本领竣工基于语义的学问检索。于是,本文的学问检索模子和方式都筑树正在本体底子之上的。

  目前讯息机构中采用的元数据计划公众源自于对馆藏举行长远生存的主意,并不不妨完整知足学问结构的哀求。通过元数据的描画,能够足够揭示元数据的元素及元素揭示实质的语义寄义,到达举行元数据互操作和对实质举行学问结构的主意,笔者要点琢磨以下题目:

  标注元数据元素的语义。元数据互操作常睹的贫穷是元素问同名异义和异名同义,RDF的思绪是若是差异元数据中的元素指向统一个资源,那么这些元素具有统一语义。凭据讯息机构数字资源的特征,选用DC元数据行为元素语义的最终证明。也即若是说差异元数据中的元素都能够运用DC元数据中的统一个字段举行证明,那么这两个元素就以为正在语义上相当。操作时将元数据与DC元数据元素之间的映照相闭放正在数据供应者方,当数据供应者正在举行注册或者运用的元数据爆发转变时,由其处分职员对映照举行界说。

  标注元数据元素实质的语义。正在处置了元数据元素的语义自此,搜罗回来的元数据该当用什么方式举行结构,与元数据元素实质的语义干系,于是还需求揭示元数据元素实质的语义。笔者通过RDF的描画办法来对元数据元素实质的语义举行揭示,框架中界说了一个闭于元数据元素实质的ontology,并通过URI筑树元素与ontology中的条件之间的相闭,以此来标注元素的语义。

  标注学问结构的实质。正在对数据源的元数据举行描画时,数据源的处分职员能够凭据元数据元素的效力对其举行区。

 

Copyright 2012-2023 南宫28(中国.NG)官方网站 版权所有 HTML地图 XML地图--备案号:鲁ICP备09041058号  备案号:鲁ICP备09041058号  
地址:山东省淄博市高新区柳泉路125号先进陶瓷产业创新园B座606室  邮箱:qht@3583100.com  电话:0533-3583100