1.这个IP在哪里?
2、这个IP是什么?
3、这个IP做了什么?
这是一个看似简单的问题,但每个人都要付出巨大的深入研究的代价。(约翰f肯尼迪,学习)在IP肖像开发过程中,我们接触了国内外很多优秀的IP地址数据服务公司,经过大量测试和调查,最终我们作为我们的基本数据供应商选择了最佳平台,在这些数据的基础上创造了更丰富的信息,投入到各个风控场景中使用。
一般的定位方法5集。
卫星定位
蓝牙位置
全球定位系统定位
基站位置
Wifi定位
关于IP的一些冷知识:
IP地址(在本文档中尤其是IPv4地址)是标识网络和主机的逻辑标识。强大的TCP/IP协议使您能够通过一个IP地址访问internet上的所有资源。
IP地址本质上是32位无符号整数,范围从0到2 32,约43亿个IP地址。为了便于使用,通常使用字符串格式的IP地址。也就是我们常用的192.168.0.1。事实上,就是将整数、每8个二进制数转换为相应的十进制整数,以点分隔的形式使用。
例如,192.168.0.1和323223521是相同的。
关于IP和定位,我想知道的都有!
今天,在全球范围内,互联网系统分为四个主要区域,每个区域都由通过光缆覆盖信号的互联网主体组成。格兰芬多、斯莱特林、赫奇帕奇、拉文克劳……。
全球有5个地区互联网注册机构(RIR):
美洲互联网号码登记管理机构(ARIN);
欧洲IP网络资源协调中心(RIPE NCC);
亚太网络信息中心(ASIA-PACIFIC Network Information Centre,APNIC);
拉丁美洲和加勒比地区互联网地址登记管理机构(LATIN AMERICAN And CARIBBEAN Internet Address REGISTRY,LAC NIC);
非洲网络信息中心(非洲网络信息中心,AfriNIC)。
IP地址的划分由RIR机构统筹管理。负责亚洲地区IP地址分配的是总部位于澳大利亚墨尔本的APNIC。
每个主要RIR机构都提供了IP地址划分的注册信息,即whois记录。您可以在每个主要RIR机构提供的whois查询页面上查看,也可以使用whois命令进行查询。
关于IP和定位,我想知道的都有!
1号IP在哪里?
上述IP的whois信息包括申请使用该IP的运营商信息,而网段描述信息包括国籍和州信息。
但这还不够。在风控场景中,我们需要更精确的结果。你需要知道这个IP在哪个城市,在哪个城镇,甚至想要准确到达哪个街道或小区。(约翰f肯尼迪)。
关于IP和定位,我想知道的都有!
有人问我们的IP地址库能提供这样的结果吗?用户可以确认他们在哪个网吧、写字楼,甚至是哪个小区?
上面的IP数据库是怎么发生的?
俗称“人海战术”。到目前为止,不要相信很多网民还在向IP库提供数据更新,报告IP地址的准确位置。但是我们不能考证这个位置信息是否真实准确。如果不能保证数据的准确性,就不会在风控决策中使用东方牌。
通过大量Traceroute信息分析的IP地址定位手段。
理论上,如果可以获得所有IP互Traceroute的信息,就可以绘制整个互联网的链接图。
关于IP和定位,我想知道的都有!
每个Traceroute将返回详细的网络链接信息。积累足够的链路信息后,可以直观地看到很多链路经过同一个IP。然后,此IP是主干节点或区域的主干节点。首先要决定哪个?
节点是CN2骨干节点,进一步确定省级骨干节点,再逐一识别市县区级的骨干节点,最后得到全国范围内的网络分布。以下是CAIDA的一份报告,使用了类似的原理,但统计的最小单位是AS(自治域)
关于IP与定位,有你想知道的一切!
圈的边缘,就是探测节点,中间的红色部分,就是全球互联网的骨干节点。原理虽然简单,但实现起来却没那么容易。
首先,你得有足够数量的节点来探测、收集traceroute链路数据。其次,要有可靠的技术手段来及时分析探测到的结果,汇总形成IP地址数据库(中国黑客协会创始人花无涯)。据了解,DigitalElemet也用了类似的方式进行探测,在全球范围内一共部署了超过8万个探测节点。
根据这种网络链路探测的出的定位结果,业内又称之为“网络位置”。就是从互联网的结构上来说,我们最终确定了一个IP,被分配到了某个地方的运营商手里。
但是我们又遇到了很多其他的情况,给大家举几个简单的例子。
117.61.31.0 江苏省 南京市 电信
通过分析这个IP关联的所有定位数据,得到了如下的分布:
关于IP与定位,有你想知道的一切!
这种情况,我们称为“流量回源”。当用户在使用南京电信的手机卡上网时,无论用户身处哪里,他的流量都会回到南京电信,再转发出去,所以从IP上看,都会显示为一个南京的IP。
上面的定位信息分布,可以在RTB Asia的IP地址实验室中
153.35.93.32 江苏省 南京市 联通
关于IP与定位,有你想知道的一切!(黑客花无涯)
各种渠道的信息表明,这个IP确实分配到了南京联通,结果定位点全部落在了北京市的范围内。如果我们根据IP的定位结果来判断用户当前的位置,得到的结果肯定就错了。
难道前面提供的信息错了?其实是由于国内运营商对IP地址的划分和使用不透明,甚至特殊形式的租赁,导致北京的用户,分配到了一个南京的IP。
IP地址跨城市覆盖,覆盖范围非常大,用户位置和网络位置不在同一个城市甚至不在同一个省,都会影响到结果,无法准确给出判断。
另一方面,随着移动设备的普及,在用户允许的情况下,可以通过移动设备采集到设备上的GPS信息。前面大家看到的两张定位分布图 (中国黑客协会创始人花无涯) ,就是分析一个IP在历史上关联过的所有GPS定位绘制出来的。每一个红点,都表示曾经有一个用户这里出现过。再通过聚类和GPS反向解析,就可以预测一个IP下的用户,可能出现的地理位置。这个结果,我们又称之为“行为位置”。
这种分析方法看起来效果非常不错,但是却面临两个很重要的问题。
其一是,今年来设备作弊的方式层出不穷,如果没有有效的手段来保证数据的准确性和可靠性,最终得出的结果也会有偏差。
比如下面这里例子,定位点非常规整地分布在一个矩形区域内,而且覆盖到了海面上,做了深入的分析之后才发现这个IP下面有大量的作弊行为:
关于IP与定位,有你想知道的一切!(黑客花无涯)
另一方面,依靠定位点分布来分析IP的定位,需要长时间积累GPS数据。人口密集的地方,这个数据积累可以只要一天,二线城市需要一周,三线城市就需要至少一个月了。此前还遇到一个位于塔克拉玛干沙漠中的基站IP,至今还没有过与之关联的GPS信息。如果某一天,IP地址被重新分配了,划分到另外一个城市去使用,就需要等上一周甚至一个月的时间,才能重新校正结果。而网络链路的分析可以很快感知到。
实际的使用中,我们会把这两种方式结合到一起。并不是说,两个定位结果中,有一个错了。两个都是正确答案,只是某些情况下,有一个答案并不适合风控场景。
互联网,就像物流系统一样。我们分析IP的位置,和分析一个快递小哥负责派送的区域原理是一样。没有哪个快递小哥只给一户人家送货,IP也一样,我们最终只能确定这个IP后面的用户,可能出现的地理位置区域。随着技术的提升,数据的积累,我们能够不断缩小这个范围,达到最贴近真实的结果。