2015年11月2日 星期一

圖片抓取教學(一):下載工具「Webpage Image Get」

「Webpage Image Get」是一款基於Chrome瀏覽器上的插件,可方便使用者抓取目前網頁上的圖片。

名稱:Webpage Image Get
安裝:https://goo.gl/d85qtt



使用教學

安裝完成後,在網頁任意處點選「滑鼠右鍵」 → 點選「取得網頁中的圖片」。



使用介面 



声優・楠田亜衣奈 温かいファンレターに「たとえ1行のお手紙でも嬉しかった」

以此網頁為例,在該網頁任意處開啟插件,即會看到上圖。

視窗中央顯示網頁上之各個圖片:每個圖片下方會顯示其「顯示類型」、「顯示檔案類型」、「Size(解析度)」;圖片右上方有兩個按鈕,左方按鈕可將該圖片儲存至本機,右方按鈕可移除該圖片。

視窗右上紅色按鈕「取得原始碼」可取得目前圖片之原始碼。

視窗右方藍色標籤「OPTION」即是這插件使用精華所在。




使用技巧

網站上之圖片,為了降低流量、方便瀏覽者瀏覽、或為了排版方便,網站時常會將圖片縮小以達成目的,我們可以將這類的小圖稱為「縮圖」,另外再將原始圖片放置於他處,有些網站會將這些圖片另外放置於其他頁面,如相簿等等;有些則是將原始圖片放置於縮圖上,以超連結的形式存在,使用者點選該「縮圖」即可連結到原始圖片。

若這一類的圖片數量很多,使用者在抓取圖片上將造成不便,使用者若土法煉鋼第一個個點開圖片將非常耗時。以下將講解如何使用「Webpage Image Get」來方便使用者一次取得所需圖片。




首先,先開啟該插件。

這時使用者可以在「OPTION」裡做設定,篩選出我們要的圖片。



原始碼輸出類型:我們要單純取出這些圖片的網址,故勾選「網址」。

顯示類型:此部分即是本文講解重點。如前面所講解的,網頁上顯示之圖片很有可能都是「縮圖」,而非原始圖片。如下圖所示,這張圖片本身並沒有縮圖,在網頁上直接以原始圖片顯示。




而像下方,則是我們提到的原始圖片及縮圖。



上圖是我們要抓取的原始圖片,下圖則是較小張的縮圖,我們必須要將這些縮圖排除,使用者可以直接點選右上方的叉叉排除掉這些圖片。但若這些縮圖非常多,一個個點選叉叉來排除也相當費時,使用者必須善用「OPTION」功能來排除。

在顯示類型的部份,第一個選項是「背景」,這選項可以取消勾選,我們要的是圖片而不是背景。第二個選項是「圖片」,這選項在網頁上的判定「即是我們所見的縮圖」,也就是下圖這張。第三個選項是「連結」,上圖這張原始圖片「以超連結的形式」存在於網頁上,使用者必須點選該縮圖才能顯示原始圖片,故這原始圖片類型即為「連結」。

總而言之,在這樣的情況下,使用者可將「背景」、「圖片」取消勾選,只勾選「連結」,即可將背景及這類較小的縮圖排除掉。

圖片最小SIZE:設定使用者所需圖片之最小解析度。此設定可以方便使用者排除網頁上各種小圖片,如按鈕icon等等,故使用者可先查詢這些原始圖片之解析度,找出解析度最小之值,或直接輸入個大概數值,使用者自行判斷大約可以排除其他小icon之解析度即可。最後我們大約取個解析度300*300。

顯示檔案類型:設定使用者所需圖片之檔案類型。這些原始圖片類型皆為JPG,使用者可以只勾選JPG,其他類型皆取消勾選。






完成上述之設定,最後點選「重新產生」。

重新產生後,使用者可以檢查最後留在畫面上的圖片是否即為使用者所需之圖片,其中最簡單的方式,可以直接從圖片數量來檢查。如重新產生後,剩下的圖片數量為十八張,而網頁中我們要抓取的圖片亦為十八張,這時即可確定設定無誤。 



接著點選視窗右上方的紅色按鈕「取得原始碼」,即可取得這些圖片的網址。若使用者想另外將這些圖片下載至本機,可使用擁有批次下載功能之下載軟體來下載這些圖片。例如「Internet Download Manager」 即可辦到。



沒有留言: