spark练习--由IP得到所在地

Posted 蜗牛不爱海绵宝宝

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark练习--由IP得到所在地相关的知识,希望对你有一定的参考价值。

  今天我们就来介绍,如何根据一个IP来求出这个IP所在的地址是什么,首先我们如果要做这个内容,那么我们要有一个IP地址的所在地字典,这个我们可以在网上购买,形如:

  

1.0.1.0|1.0.3.255|16777472|16778239|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302
1.0.8.0|1.0.15.255|16779264|16781311|亚洲|中国|广东|广州||电信|440100|China|CN|113.280637|23.125178
1.0.32.0|1.0.63.255|16785408|16793599|亚洲|中国|广东|广州||电信|440100|China|CN|113.280637|23.125178
1.1.0.0|1.1.0.255|16842752|16843007|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302

   这个只是其中的一个小部分,我们可以来介绍一下这个如何查看,当我如果获取一个IP,那我们首先先把这个IP转换成为一个Long型的值,其中的转换方法,后文会有介绍,然后我们在看上面的数据,以第一条数据为例

  1.0.1.0|1.0.3.255|16777472|16778239|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302

  这个以‘|‘来作为分隔符,其中的第二三个数字分别为:16777472,16778239这两个数字,这个表示如果我们把上面的IP转换成为Long值的情况,如果这个long的大小在16777472与16778239之间,那我们就可以说,这个IP是中国福建的电信,好了,解释完成之后,我们就可以开始写代码了

package cn.wj.spark.day06

import java.io.{BufferedReader, FileInputStream, InputStreamReader}

import scala.collection.mutable.ArrayBuffer

/**
  * Created by WJ on 2017/1/4.
  */
object IPLocationDemo_2 {

  // 将IP转换成为Long值
  def ip2Long(ip:String):Long ={
    val fragments = ip.split("[.]")
    var ipNum = 0L
    for(i <- 0 until fragments.length){
      ipNum = fragments(i).toLong | ipNum << 8L       //8进制变为10进制
    }
    ipNum
  }
   //进行二分法的查找,这个的前提是顺序已经是排序过的了
  def binarySearch(lines: ArrayBuffer[String], ip: Long) : Int = {
    var low = 0
    var high = lines.length - 1
    while (low <= high) {
      val middle = (low + high) / 2
      if ((ip >= lines(middle).split("\\|")(2).toLong) && (ip <= lines(middle).split("\\|")(3).toLong))
        return middle
      if (ip < lines(middle).split("\\|")(2).toLong)
        high = middle - 1
      else {
        low = middle + 1
      }
    }
    -1
  }

  //从一个文件里面读取数据
  def readData(path:String) = {
    val br = new BufferedReader(new InputStreamReader(new FileInputStream(path)))
    var s:String  = null
    var flag = true
    var lines = ArrayBuffer[String]()
    while(flag){
      s = br.readLine()
      if(s != null)
        lines += s
      else
        flag = false
    }
    lines
  }

  def main(args: Array[String]): Unit = {
    val ip ="118.144.130.10"
    val ipNum = ip2Long(ip)
    println(ipNum)
    val lines = readData("e://Test/ip.txt")
    val index = binarySearch(lines,ipNum)
    println(lines(index))
  }
}

 

  

以上是关于spark练习--由IP得到所在地的主要内容,如果未能解决你的问题,请参考以下文章

如何通过IP地址得到用户所在的城市名?怎样写代码?

在这个 spark 代码片段中 ordering.by 是啥意思?

python+spark程序代码片段

Spark StreamingSpark Day10:Spark Streaming 学习笔记

Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段

spark关于join后有重复列的问题(org.apache.spark.sql.AnalysisException: Reference '*' is ambiguous)(代码片段