使用 Twitter4j 收集带有地理标签的推文

Posted

技术标签:

【中文标题】使用 Twitter4j 收集带有地理标签的推文【英文标题】:Collecting geotagged tweets with Twitter4j 【发布时间】:2013-06-25 10:31:59 【问题描述】:

大家好,

   public static void main(String[] args) 
    ConfigurationBuilder cb = new ConfigurationBuilder();
    cb.setDebugEnabled(true);
    cb.setOAuthConsumerKey("xxxxxx");
    cb.setOAuthConsumerSecret("xxxx");
    cb.setOAuthAccessToken("xxxx");
    b.setOAuthAccessTokenSecret("xxxxxxx");

    TwitterStream twitterStream = new    TwitterStreamFactory(cb.build()).getInstance();

    StatusListener listener = new StatusListener() 

        @Override
        public void onException(Exception arg0) 
            // TODO Auto-generated method stub

        

        @Override
        public void onDeletionNotice(StatusDeletionNotice arg0) 
            // TODO Auto-generated method stub

        

        @Override
            public void onScrubGeo(long arg0, long arg1) 
            // TODO Auto-generated method stub

        

        @Override
        public void onStatus(Status status) 
            User user = status.getUser();

            // gets Username
            String username = status.getUser().getScreenName();
            System.out.println(username);
            String profileLocation = user.getLocation();
            System.out.println(profileLocation);
            long tweetId = status.getId(); 
            System.out.println(tweetId);
            String content = status.getText();
            System.out.println(content +"\n");
            GeoLocation geolocation = status.getGeoLocation();

            System.out.println(geolocation +"\n");


        

        @Override
        public void onTrackLimitationNotice(int arg0) 
            // TODO Auto-generated method stub
            System.out.println("onTrackLimitationNotice" +"\n");

        

        @Override
        public void onStallWarning(StallWarning arg0) 
            // TODO Auto-generated method stub
            System.out.println("onStallWarning" +"\n");

        

    ;
    FilterQuery fq = new FilterQuery();
    double lat = 53.186288;
    double longitude = -8.043709;
    double lat1 = lat - 4;
    double longitude1 = longitude - 8;
    double lat2 = lat + 4;
    double longitude2 = longitude + 8;
    twitterStream.addListener(listener);
    double[][] bb= lat1,longitude1, lat2 ,longitude2;

    // fq.track(keywords);
    fq.locations(bb);


    twitterStream.filter(fq);  


此代码用于在英国和爱尔兰的一般位置收集推文,但不收集推文,或者有时(很少)收集来自边界框外区域的推文。

如果我扩大边界框,我确实会收到推文,但有时它们会在边界框之外。

我的工作逻辑是边界框的第一个点是 SW 角,下一个点是 NE 角。

任何想法可能是什么问题?我正在使用 Twitter4j 3.0.3

谢谢,

大卫

【问题讨论】:

例如,在运行此代码时,我收到了来自塞舌尔 -4.65842064, 55.40764413 的推文......所以显然我的逻辑在某处是错误的,因为我的边界框应该是 49.186288, - 16.043709,57.186288,0.043709?这条推文应该在它之外 【参考方案1】:

我认为您以错误的顺序发送坐标。根据Filter Spec,Twitter 需要以逗号分隔的经度、纬度列表,但您发送的是(纬度、经度)对。

正确的版本应该是:

double lat = 53.186288;
double longitude = -8.043709;
double lat1 = lat - 4;
double longitude1 = longitude - 8;
double lat2 = lat + 4;
double longitude2 = longitude + 8;

double[][] bb = longitude1, lat1, longitude2, lat2;

FilterQuery fq = new FilterQuery();
fq.locations(bb);
twitterStream.filter(fq);  

【讨论】:

是的 - 谢谢。抱歉,我想我会说“纬度和经度”的方式 我还注意到我仍然收到将地理位置返回为“null”的推文 - 想知道为什么 API 会给我这些推文? 刚刚对 curl 进行了相同的请求,并为每条推文返回了有效的坐标字段:... "coordinates":"type":"Point","coordinates":[-1.27016675,52.99986186] ...看起来响应是预期的,并且每条推文都与位置过滤器匹配。

以上是关于使用 Twitter4j 收集带有地理标签的推文的主要内容,如果未能解决你的问题,请参考以下文章

尝试使用 Python Jupyter Notebook 将带有地理标记的推文流式传输到 PostgreSQL 时出现问题

twitter4j.Status 是不是在每条推文上返回地理位置

如何收听仅包含来自 Twitter 流的地理信息的推文

Tweepy 位置过滤器不起作用

Twitter - 查询特定地理位置半径内的推文

使用 MGTwitterEngine 发布的推文会丢失位置坐标?