扫码一下
查看教程更方便
item是用于收集从网站上删除的数据的容器。 我们必须通过定义项目来启动蜘蛛。 要定义项目,请编辑目录 first_scrapy(自定义目录)下的 items.py 文件。 items.py 如下所示
import scrapy
class first_scrapyitem(scrapy.item):
# define the fields for your item here like:
# name = scrapy.field()
myitem 类继承自 item,其中包含一些 scrapy 已经为我们构建的预定义对象。 例如,如果我们想从站点中提取名称、url 和描述,则需要为这三个属性中的每一个定义字段。
因此,让我们添加那些我们想要收集的项目
from scrapy.item import item, field
class first_scrapyitem(scrapy.item):
name = scrapy.field()
url = scrapy.field()
desc = scrapy.field()