<<返回图片数据

互联网图片库(SogouP)版本:2012

介绍:

互联网图片库来自sogou图片搜索所索引的部分数据。其中收集了包括人物、动物、建筑、机械、风景、运动等类别,总数高达2,836,535张图片。对于每张图片,数据集中给出了图片的原图、缩略图、所在网页以及所在网页中的相关文本。

格式说明:

共包括四个文件:Meta_Data, Original_Pic, Pages, Zoomed_Pic。其中Meta_Data存储图片的相关元数据:Original_Pic中存储图片的原图;Pages中存储图片所在的页面;Zoomed_Pic中存储所有图片的缩略图,缩略图大小为130*130左右。

Meta_Data文件包含所有图片的相关元数据,格式如下:

<PIC>

<PIC_URL>图片在互联网中的URL地址</PIC_URL>

<PAGE_URL>图片所在网页的URL地址</PAGE_URL>

<ALT_TEXT>图片的替换文字</ALT_TEXT>

<ANCHOR_TEXT>以图片为目标的超链接的显示文本</ANCHOR_TEXT>

<SUR_TEXT>页面中提取的图片周围的文本</SUR_TEXT>

<PAGE_TITLE>图片所在页面的标题</PAGE_TITLE>

<WIDTH>图片的宽度</WIDTH>

<HEIGHT>图片的高度</HEIGHT>

</PIC>

相关任务:

基于文本/内容的图片检索

相关资源:

互联网语料库

下载:

下载前请仔细阅读“搜狗实验室数据使用许可协议

Please read the "License for Use of Sogou Lab Data" carefully before downloading.

完整版(269GB):(硬盘拷贝)

反馈:

线上反馈留下您的宝贵意见和建议。

资源下载FAQ中查找您遇到的资源下载问题的答案