论文部分内容阅读
语义学技术使得数字和代表其含义的信息紧紧绑定。
没有了语境,一个数字可能是很危险的事情。例如1991年,美国航空航天局(NASA)的耗资1亿2千5百万美金的火星气象卫星计划的失败,正是因为一组工程师在使用了英制度量,而另一组却使用的是公制单位。结果,飞船被下令围绕一个危险的低纬度进行环绕飞行,从而导致其在火星大气中焚毁。
相似的与数字相关的混乱在地球上无时无刻都在发生,尽管不是都带来灾难性后果。真实工程技术(True Engineering Technology)这家位于马萨诸塞州剑桥市的公司,已经开发出了语义学技术,向数字数据添加含义,以阻止这种错误信息传递的发生。
公司近日发布了一个叫做数字空间(Numberspace)的网页,允许用户上传各种数字片段——例如按公里计算的从纽约到伦敦的距离(5581)。一旦它被语义学标记,信息就可以在不丢失含义的情况下共享。用户也可以购买商业版本来在私人服务器上存储他们的信息。
为了在系统中存储一个数据——创造公司所谓的“纯数字”(truenumber)——用户只需简单地向网站上的一个表格里输入短语。对于上例,用户可能输入“以公里计算,从纽约到伦敦的距离是5581公里”。真实工程技术公司的软件会解析这些短语,提取数字5581和由关键字和短语,例如“纽约”、“伦敦”、“距离”等传递的含义。用户可以向纯数字增加标注和评论,例如它是怎么计算的,或者是否有质疑其准确性的问题。
真实工程技术公司的首席执行官艾伦·雷斯多(Allen Razdow)认为,这项技术对那些依赖精确数字做重要决策的产业很有吸引力,尤其是工程公司。例如,在一家自动化工厂的工人可能需要从一系列不同电子文档中查看最近的排放物数字。通过将这些数字存储为“纯数字”,任何工人就可以在线查找最新最准确的数据。该系统也能实现自动单位转换,并标注出潜在的不匹配或错误之处。用户也能将“纯数字”粘贴到网页或者微软的办公文件中,使得它们能够和存储在网络服务器上的语境数据保持关联。
雷斯多认为,这项技术是迈向语义学网页的重要进展,语义学网页的目标是使计算机不仅可以存储信息本身,更要存储其意义。他说:“我认为,这是如何再现那些具有最大限度语义信息的进展,是本质上的、实际的进化。”他认为,数字是很好的下手点,因为人们在使用它们时往往遵循一定的规则。例如,很容易训练系统识别那些代表距离的单位,并在用户输入“5581秒”表示距离时,弹出错误警告。
“过去,我们认为数字有绝对价值和绝对测量权限,其实并非如此。”布鲁斯·詹金斯(Bruce Jenkins)说到。他是马萨诸塞州剑桥市Ora Research的分析员,曾经听取了该技术的介绍。
詹金斯说:“在一个系统中,数字的出身和权限在该技术下会体现得更加明显,那些弱点和对数字权限的疑问将更容易被发现和更正。”
伦斯勒理工学院(Rensselaer Polytechnic Institute)的计算机科学教授吉姆·亨德乐(Jim Hendler)认为,这种方法和他所期望的语言学技术商业化的模式是一致的。他说:“语义学网页是真正的基础结构技术,能改进我们在网络上已经可以做的事情,并创造新的应用。”
一些观察员质疑,用户是否会花费时间来向语义学系统增加语义信息以维持更新。但亨德乐说。如果系统设计得好,增加语义信息在长远意义上可以为用户节省时间。他说:“认为元数据使事情变得更困难或者导致更多工作量完全是一个错误。”
雷斯多说,尽管数字空间起初只将市场定位在工程公司,但该网页仍可用于任何需要处理大量数据的领域。他说,研究公司、新闻工作者和学术工作者都会从中受益。
没有了语境,一个数字可能是很危险的事情。例如1991年,美国航空航天局(NASA)的耗资1亿2千5百万美金的火星气象卫星计划的失败,正是因为一组工程师在使用了英制度量,而另一组却使用的是公制单位。结果,飞船被下令围绕一个危险的低纬度进行环绕飞行,从而导致其在火星大气中焚毁。
相似的与数字相关的混乱在地球上无时无刻都在发生,尽管不是都带来灾难性后果。真实工程技术(True Engineering Technology)这家位于马萨诸塞州剑桥市的公司,已经开发出了语义学技术,向数字数据添加含义,以阻止这种错误信息传递的发生。
公司近日发布了一个叫做数字空间(Numberspace)的网页,允许用户上传各种数字片段——例如按公里计算的从纽约到伦敦的距离(5581)。一旦它被语义学标记,信息就可以在不丢失含义的情况下共享。用户也可以购买商业版本来在私人服务器上存储他们的信息。
为了在系统中存储一个数据——创造公司所谓的“纯数字”(truenumber)——用户只需简单地向网站上的一个表格里输入短语。对于上例,用户可能输入“以公里计算,从纽约到伦敦的距离是5581公里”。真实工程技术公司的软件会解析这些短语,提取数字5581和由关键字和短语,例如“纽约”、“伦敦”、“距离”等传递的含义。用户可以向纯数字增加标注和评论,例如它是怎么计算的,或者是否有质疑其准确性的问题。
真实工程技术公司的首席执行官艾伦·雷斯多(Allen Razdow)认为,这项技术对那些依赖精确数字做重要决策的产业很有吸引力,尤其是工程公司。例如,在一家自动化工厂的工人可能需要从一系列不同电子文档中查看最近的排放物数字。通过将这些数字存储为“纯数字”,任何工人就可以在线查找最新最准确的数据。该系统也能实现自动单位转换,并标注出潜在的不匹配或错误之处。用户也能将“纯数字”粘贴到网页或者微软的办公文件中,使得它们能够和存储在网络服务器上的语境数据保持关联。
雷斯多认为,这项技术是迈向语义学网页的重要进展,语义学网页的目标是使计算机不仅可以存储信息本身,更要存储其意义。他说:“我认为,这是如何再现那些具有最大限度语义信息的进展,是本质上的、实际的进化。”他认为,数字是很好的下手点,因为人们在使用它们时往往遵循一定的规则。例如,很容易训练系统识别那些代表距离的单位,并在用户输入“5581秒”表示距离时,弹出错误警告。
“过去,我们认为数字有绝对价值和绝对测量权限,其实并非如此。”布鲁斯·詹金斯(Bruce Jenkins)说到。他是马萨诸塞州剑桥市Ora Research的分析员,曾经听取了该技术的介绍。
詹金斯说:“在一个系统中,数字的出身和权限在该技术下会体现得更加明显,那些弱点和对数字权限的疑问将更容易被发现和更正。”
伦斯勒理工学院(Rensselaer Polytechnic Institute)的计算机科学教授吉姆·亨德乐(Jim Hendler)认为,这种方法和他所期望的语言学技术商业化的模式是一致的。他说:“语义学网页是真正的基础结构技术,能改进我们在网络上已经可以做的事情,并创造新的应用。”
一些观察员质疑,用户是否会花费时间来向语义学系统增加语义信息以维持更新。但亨德乐说。如果系统设计得好,增加语义信息在长远意义上可以为用户节省时间。他说:“认为元数据使事情变得更困难或者导致更多工作量完全是一个错误。”
雷斯多说,尽管数字空间起初只将市场定位在工程公司,但该网页仍可用于任何需要处理大量数据的领域。他说,研究公司、新闻工作者和学术工作者都会从中受益。