您的位置: 网界网 > 软件 > 正文

NASA使用文本分析保障航空安全

2012年09月24日 20:45:34 | 作者:Nicole Laskowski | 来源:TechTarget中国  | 查看本文手机版

摘要:本文内容为NASA首席数据科学家Ashok Srivastava谈论航空领域的数据分析与预测问题。

标签
NASA
商务智能
数据分析

飞机旅行似乎已快要达到很多乘客的忍耐极限——座位间距小、食物选择少、飞行时间长,还有就是安检的等待和催促。

旅行者们在经过主要枢纽机场的时候都已经做好了这样的心理准备。不过,他们有可能不知道,在每次飞行的背后,都有着大量数据的生成;只有对它们进行采集、挖掘、分析才能保证飞行安全。虽然大部分数据都是结构化数据,但是也有一部分是文本形式,来自撰写报告、音频录音和警示信号。

NASA使用文本分析保障航空安全

NASA首席数据科学家Ashok Srivastava说:“所有人都知道国家空域非常安全。”Srivastava是系统范围安全保险技术项目(SSAT)的牵头人,列举了1959到2006年每年的死亡事故率,来证明近五十年间这一比率的稳固下滑趋势。

“但现在的问题是,在不断增加的航班数量中,怎样才能让航行变得更安全一些?”

在今年夏天第八届年度文本分析峰会(Text Analytics Summit)的演讲中,Srivastava提到,每年的航班增长率可达2%到3%,根据具体经济情况上下波动。而交通统计局(Bureau of Transportation Statistics)的报告显示,美国交通部仅在2011年一年中就记录了1000万次国内和国际商业航班。如果增长率为2%,那就是说每年都有几十万次新的航班开通,给空域加压。

他说:“如果是这样的情况,我们只有寻找到提高安全性的方式,才能保持低事故率。这是一个NASA和其他机构目前正在努力的领域,关键就在于必须大力控制住风险。”

通过文本分析得出事件原因

Srivastava和他的团队会仔细分析发生的异常事故,其中一个方法就是在地图上按照连续性把它们标识出来,通常从一个安全的州开始。而对于那些在连续性中“反常的州”,团队会特别注意,因为这意味着事有蹊跷、值得警惕;他们会在这样的地方上做下记号,提示该路线安全系数低,可选择回航到安全的州。

“文本在理解事件中所扮演的角色越来越重要。”

团队对运营数据进行分析,识别在反常的州发生的事件,同时也会参考机组和地勤工作人员的报告。Srivastava称,这些报告能够帮助他们理解事件发生的随机因素和实际原因。

在金融业中,按秒以计的数字数据可以显示股票走势,而媒体报告能够解析数字之外股票涨跌的原因。航空报告也是这样。

“单凭数字数据本身,我们没办法分析出事故的原因。”

Srivastava举出实例,大概一年多以前,肯尼迪国际机场发生了一次事故,埃及航空公司的986次航班和德国汉莎航空公司的411次航班在跑道上差点发生碰撞,还好没有酿成惨剧。

“请问这次事故为什么会发生?是怎么回事?我们又怎样对这次数据进行分析?”对此(+微信关注网络世界),他们展开了调查,包括分析飞行员与控制塔之间的音频录音,后来得知是埃及航空公司的航班转错了弯。NASA还处在音频分析的初级阶段,即将录音转制为文本内容。

搞清楚了是怎么一回事之后,Srivastava和他的团队着眼于从随机因素中提取出预测信息,以防止未来类似事故的发生。

他说:“这对今天的系统安全来讲至关重要,对明天的系统更是如此。”

从分析走向预测

数据分析流程中有一种传统的方法,即单独分析数字数据和文本数据,然后再把它们整合到一起,得出结论。

Srivastava说:“很多人都在采用这种方式,我认为很有效,但是我们的做法完全不同。”

他们把数据汇集到同一个系统,对所有数据一并分析,包括雷达和卫星系统中的网络数据、软件中的航空数据、引擎和传感器数据、地勤和机组人员的地面文本数据等等。分析在单一架构中通过一级支持无线电导航(一种学习模型、检测模式的机器)完成。

他说:“通过短时间内把所有数据汇集到一起、进行同时分析,我们能够对诸如航空系统这样的真实系统进行高精确度预测。”

数据和文本一样,都可以通过不同的途径、运用多样化的方式进行分析,比如算法式和可视化;这使得NASA和其他机构能够密切关注流行趋势、事件的增幅减幅以及跑道入侵事故的因素。

Srivastava提及了企业在发展自己和规避风险时所采取的主动立场:就像企业社区一样,NASA和其他机构正在尝试着各种臆测、策略和技术,以期能够将问题在发生之前就扼杀在摇篮之中。

“而整个系统的命运都将由数据分析来决定。”

[责任编辑:软件频道 yu_xiang@cnw.com.cn]