教程 > scrapy 教程 > 阅读：50

scrapy 统计收集——迹忆客-ag捕鱼王app官网

stats collector 是 scrapy 提供的一种工具，用于以键/值的形式收集统计信息，并使用 crawler api 访问它（crawler 提供对所有 scrapy 核心组件的访问）。统计收集器为每个蜘蛛提供一个统计表，其中统计收集器在蜘蛛打开时自动打开，并在蜘蛛关闭时关闭统计收集器。

常见的统计数据收集器用途

以下代码使用 stats 属性访问统计信息收集器。

class extensionthataccessstats(object): 
   def __init__(self, stats): 
      self.stats = stats  
   
   @classmethod 
   def from_crawler(cls, crawler): 
      return cls(crawler.stats)

下表显示了可与统计信息收集器一起使用的各种选项


stats.set_value('hostname', socket.gethostname())
stats.inc_value('customized_count')
stats.max_value('max_items_scraped', value)
stats.min_value('min_free_memory_percent', value)
stats.get_value('customized_count')
stats.get_stats() {'custom_count': 1, 'start_time': datetime.datetime(2009, 7, 14, 21, 47, 28, 977139)}

序号	参数	描述
1	`stats.set_value('hostname', socket.gethostname())`	它用于设置统计值。
2	`stats.inc_value('customized_count')`	它增加了统计值。
3	`stats.max_value('max_items_scraped', value)`	我们可以设置统计值，仅当大于先前值时。
4	`stats.min_value('min_free_memory_percent', value)`	我们可以设置统计值，仅当低于以前的值时。
5	`stats.get_value('customized_count')`	它获取统计值。
6	`stats.get_stats() {'custom_count': 1, 'start_time': datetime.datetime(2009, 7, 14, 21, 47, 28, 977139)}`	它获取所有统计数据

可用的统计数据收集器

scrapy 提供了不同类型的统计收集器，可以使用 stats_class 设置进行访问。

memorystatscollector

它是默认的 stats 收集器，它维护用于抓取的每个蜘蛛的统计信息，数据将存储在内存中。

class scrapy.statscollectors.memorystatscollector

dummystatscollector

这个统计收集器非常高效，什么也不做。这可以使用 stats_class 设置进行设置，并可用于禁用统计信息收集以提高性能。

class scrapy.statscollectors.dummystatscollector

 scrapy 日志服务

scrapy 发送邮件 

ag捕鱼王app官网计算机编程教程

scrapy 统计收集——迹忆客-ag捕鱼王app官网

常见的统计数据收集器用途

可用的统计数据收集器

memorystatscollector

dummystatscollector

查看笔记

scrapy 统计收集——迹忆客-ag捕鱼王app官网

常见的统计数据收集器用途

可用的统计数据收集器

memorystatscollector

dummystatscollector

 查看笔记

查看笔记