使用 Twitter4j 收集带有地理标签的推文
Posted
技术标签:
【中文标题】使用 Twitter4j 收集带有地理标签的推文【英文标题】:Collecting geotagged tweets with Twitter4j 【发布时间】:2013-06-25 10:31:59 【问题描述】:大家好,
public static void main(String[] args)
ConfigurationBuilder cb = new ConfigurationBuilder();
cb.setDebugEnabled(true);
cb.setOAuthConsumerKey("xxxxxx");
cb.setOAuthConsumerSecret("xxxx");
cb.setOAuthAccessToken("xxxx");
b.setOAuthAccessTokenSecret("xxxxxxx");
TwitterStream twitterStream = new TwitterStreamFactory(cb.build()).getInstance();
StatusListener listener = new StatusListener()
@Override
public void onException(Exception arg0)
// TODO Auto-generated method stub
@Override
public void onDeletionNotice(StatusDeletionNotice arg0)
// TODO Auto-generated method stub
@Override
public void onScrubGeo(long arg0, long arg1)
// TODO Auto-generated method stub
@Override
public void onStatus(Status status)
User user = status.getUser();
// gets Username
String username = status.getUser().getScreenName();
System.out.println(username);
String profileLocation = user.getLocation();
System.out.println(profileLocation);
long tweetId = status.getId();
System.out.println(tweetId);
String content = status.getText();
System.out.println(content +"\n");
GeoLocation geolocation = status.getGeoLocation();
System.out.println(geolocation +"\n");
@Override
public void onTrackLimitationNotice(int arg0)
// TODO Auto-generated method stub
System.out.println("onTrackLimitationNotice" +"\n");
@Override
public void onStallWarning(StallWarning arg0)
// TODO Auto-generated method stub
System.out.println("onStallWarning" +"\n");
;
FilterQuery fq = new FilterQuery();
double lat = 53.186288;
double longitude = -8.043709;
double lat1 = lat - 4;
double longitude1 = longitude - 8;
double lat2 = lat + 4;
double longitude2 = longitude + 8;
twitterStream.addListener(listener);
double[][] bb= lat1,longitude1, lat2 ,longitude2;
// fq.track(keywords);
fq.locations(bb);
twitterStream.filter(fq);
此代码用于在英国和爱尔兰的一般位置收集推文,但不收集推文,或者有时(很少)收集来自边界框外区域的推文。
如果我扩大边界框,我确实会收到推文,但有时它们会在边界框之外。
我的工作逻辑是边界框的第一个点是 SW 角,下一个点是 NE 角。
任何想法可能是什么问题?我正在使用 Twitter4j 3.0.3
谢谢,
大卫
【问题讨论】:
例如,在运行此代码时,我收到了来自塞舌尔 -4.65842064, 55.40764413 的推文......所以显然我的逻辑在某处是错误的,因为我的边界框应该是 49.186288, - 16.043709,57.186288,0.043709?这条推文应该在它之外 【参考方案1】:我认为您以错误的顺序发送坐标。根据Filter Spec,Twitter 需要以逗号分隔的经度、纬度列表,但您发送的是(纬度、经度)对。
正确的版本应该是:
double lat = 53.186288;
double longitude = -8.043709;
double lat1 = lat - 4;
double longitude1 = longitude - 8;
double lat2 = lat + 4;
double longitude2 = longitude + 8;
double[][] bb = longitude1, lat1, longitude2, lat2;
FilterQuery fq = new FilterQuery();
fq.locations(bb);
twitterStream.filter(fq);
【讨论】:
是的 - 谢谢。抱歉,我想我会说“纬度和经度”的方式 我还注意到我仍然收到将地理位置返回为“null”的推文 - 想知道为什么 API 会给我这些推文? 刚刚对 curl 进行了相同的请求,并为每条推文返回了有效的坐标字段:... "coordinates":"type":"Point","coordinates":[-1.27016675,52.99986186] ...看起来响应是预期的,并且每条推文都与位置过滤器匹配。以上是关于使用 Twitter4j 收集带有地理标签的推文的主要内容,如果未能解决你的问题,请参考以下文章
尝试使用 Python Jupyter Notebook 将带有地理标记的推文流式传输到 PostgreSQL 时出现问题