资源说明:推特爬虫
可配置的Twitter爬网程序(基于Java)可用于通过REST和STREAMING端点以及基于收集数据。
新闻(21/9/2017) :可用的搜寻器版本0.5,可以为两个STREAMING端点搜寻器(关键字过滤的搜寻器和边界框过滤的搜寻器)配置已搜寻的推文到磁盘的存储频率。 通过属性文件,用户可以设置要在内存中保留的已爬网推文的最大数量,然后再将它们刷新到磁盘文件中。 这样,避免了过多的磁盘写操作(因为它们被分组为突发)。 以下是两个STREAMING端点搜寻器(关键字过滤的搜寻器和边界框过滤的搜寻器)的属性文件的描述中的更多详细信息。
核心功能:
时间轴,基于关键字和基于用
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。