<<返回图片数据
互联网图片库(SogouP)版本:2012
介绍:
互联网图片库来自sogou图片搜索所索引的部分数据。其中收集了包括人物、动物、建筑、机械、风景、运动等类别,总数高达2,836,535张图片。对于每张图片,数据集中给出了图片的原图、缩略图、所在网页以及所在网页中的相关文本。
格式说明:
共包括四个文件:Meta_Data, Original_Pic, Pages, Zoomed_Pic。其中Meta_Data存储图片的相关元数据:Original_Pic中存储图片的原图;Pages中存储图片所在的页面;Zoomed_Pic中存储所有图片的缩略图,缩略图大小为130*130左右。
Meta_Data文件包含所有图片的相关元数据,格式如下:
<PIC>
<PIC_URL>图片在互联网中的URL地址</PIC_URL>
<PAGE_URL>图片所在网页的URL地址</PAGE_URL>
<ALT_TEXT>图片的替换文字</ALT_TEXT>
<ANCHOR_TEXT>以图片为目标的超链接的显示文本</ANCHOR_TEXT>
<SUR_TEXT>页面中提取的图片周围的文本</SUR_TEXT>
<PAGE_TITLE>图片所在页面的标题</PAGE_TITLE>
<WIDTH>图片的宽度</WIDTH>
<HEIGHT>图片的高度</HEIGHT>
</PIC>
相关任务:
基于文本/内容的图片检索
相关资源:
下载:
下载前请仔细阅读“搜狗实验室数据使用许可协议”
Please read the "License for Use of Sogou Lab Data" carefully before downloading.
完整版(269GB):(硬盘拷贝)
反馈:
在线上反馈留下您的宝贵意见和建议。
在资源下载FAQ中查找您遇到的资源下载问题的答案