移动数据:电信公司的金矿_Tomelephant_百度空间
我们日常生活使用手机的活动数据, 行业和学术界研究人员都饶有兴致的盯着。移动电话公司发现,他们正蹲在一个金矿面前,这座金矿就是用户的通话记录 。在移动行业日益增多的学术界的研究人员,处理大型数据库,数据库显示电话和短信时间和地点,这些信息透露出人们的生活习惯,公众活动参与率,甚至重大的社 会趋势。

  呼叫中心: 这个网络显示比利时大概两百万的手机用户六个月的通话呼叫。每个点代表一组人之间的相连,颜色代表他们使用的语言。荷兰语(绿色)和法语(红色)社交网络是泾渭分明,之间只有一小撮在布鲁塞尔的用户群联系.
随着潜在应用城市规划到营销,这种研究也可以为移动电话公司提供一个新的收入来源 的。 “由于手机已经非常普及,挖掘他们的数据能真正产生革命性的人类行为研究”Ramón Cáceres说,他是新泽西州的AT&T公司的研究实验室首席研究员。

   如果你是AT&T的用户,并且去年3月15日和5月15日在洛杉矶和纽约之间附近,你的数据有百分之五的可能被Cáceres和他的同事们用于本公司的用户出行习惯的研究。研究人员在891邮政编码区从数十万用户中积累了数以百万计的通话记录,覆盖纽约的每一个市镇,新泽西州10个县,以及洛杉矶,奥兰治,并在加利福尼亚州文图拉县。

   这些数据集有呼叫详细记录或CDR(采集手机数据源标准)。CDR是语音或短信通讯而生成的。除其他外,它显示了呼叫方和被叫的次数,类型和连接的持续时间,以及最重要的是,所连接的发射塔的独立ID。

   这样CDR生成的时候,AT&T公司的工作人员就知道呼叫电话所在的半径一英里的位置,从而能够确定每个手机每天的出行离家的距离。该小组发现,平均来说曼哈顿的人们大部分时间生活在2.5英里的范围,而洛杉矶则是5英里。 “但我们也发现,看看那些出门最远的人,纽约人范围更远,相比洛杉矶的29英里他们是69英里”Cáceres说。

   Cáceres希望与城市规划师合作,因为他们不得与做昂贵和有限的统计调查,搜集有关资料。 “这种类型的数据可以帮助他们决定如何投入资源,例如,如果他们想知道在哪里建立一个新的火车或地铁站,”Cáceres说。 AT&T正在和剑桥,麻省理工提出合作,这个月的早些时候,AT&T 在网络科学已经是NetSci协会的一员。

   如果你是AT&T的用户,并且去年3月15日和5月15日在洛杉矶和纽约之间附近,你的数据有百分之五的可能被Cáceres和他的同事们用于本公司的用户出行习惯的研究。研究人员在891邮政编码区从数十万用户中积累了数以百万计的通话记录,覆盖纽约的每一个市镇,新泽西州10个县,以及洛杉矶,奥兰治,并在加利福尼亚州文图拉县。

   这些数据集有呼叫详细记录或CDR(采集手机数据源标准)。CDR是语音或短信通讯连接而生成的。除其他信息外,它显示了呼叫方和被叫的号码,类型和连接的持续时间,以及最重要的是——所连接的发射塔的独立ID。

   这样CDR生成的时候,AT&T公司的工作人员就知道呼叫电话所在的半径一英里的位置,从而能够确定每个手机每天的出行离家的距离。该小组发现,平均来说曼哈顿的人们大部分时间生活在2.5英里的范围,而洛杉矶则是5英里。 “但我们也发现,那些出门较远的人,纽约人范围更远,在工作日相比洛杉矶的29英里他们是69英里” Cáceres说。

   Cáceres希望与城市规划师合作,因为他们不得与做昂贵和有限的统计调查,搜集有关资料。 “这种类型的数据可以帮助他们决定如何投入资源,例如,如果他们想知道在哪里建立一个新的火车或地铁站,”Cáceres说。 AT&T正在和剑桥,麻省理工提出合作,这个月的早些时候,AT&T 在网络科学已经是NetSci协会的一员。

   现在,Cáceres的小组正在寻求合作而不是商业化。但是,手机网络正在思考对他们的数据转成收益,Jean Bolot说,他是网络运营商Sprint的研究员。这意味着一个“双面”的经营模式,他们不仅为最终用户,而且也通过其他企业合作获得盈利。 “这是在电信领域的新的,但在其他领域已有先例 - 比如Google。”他说。

   因为几乎每个人都有手机,数据的规模巨大得是其他来源无法比拟的。移动性模式,例如,可用于调整属性或广告牌的广告价格。 “几乎所有在这个星球上的商人现在已经在考虑这个了。” Bolot 说。

   另一项研究,由麻省理工学院科学家Francesco Calabrese和同事提出,从大波士顿约一百万部手机相关位置的追踪得出了一些公共活动(如棒球赛)的列表,显示人们如何前往参加这些活动。 “我们可以部分的预测人们是否参与将要来临的活动”,该小组的一份工作报告这样阐述,这说明将来有可能为特别活动提供准确的交通预测。

   在这方面的研究已经有突破,发展出新的算法可以有效地处理数以不大量的链接组成的大型网络,Vincent Blondel说,他组织剑桥研讨会,是布鲁塞尔附近鲁汶天主教大学应用数学教授。

   Blondel的研究包括两百万比利时手机用户之间连接的分析。据透露,该国法语和荷语人口几乎很少电话和短信联系。 “这很有趣,因为已经有讨论比利时分裂成两个国家”Blondel说。

   在这方面的研究通常是看重群体信息,而不是个人。然而有关如何保护用户隐私仍然存在存在,Blondel说。从CDR中去掉用户姓名和号码是一个标准做法,但关联到地点和通话时间,配合其他数据库还是可以帮助识别出个人。而在麻省理工学院的研究,团队可以通过定位晚上10点到上午07点出现最多的位置而推断出用户最可能的家庭位置,另外他们也将用户按照邮编区号分组。

   “我觉得科学界负起采集有用的数据和保护隐私之间平衡的责任”Blondel表示,他正在研究使用模糊数据技术的效果,而不是使用来自数据库的xx的位置信息或者通话的具体时间信息。

原文:
编译:


郑重声明:资讯 【移动数据:电信公司的金矿_Tomelephant_百度空间】由 发布,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
—— 相关资讯 ——