爬蟲 – 使用 HtmlAgilityPack 抓取 Yahoo 英文單字與 KK

      在〈爬蟲 – 使用 HtmlAgilityPack 抓取 Yahoo 英文單字與 KK〉中留言功能已關閉

因為Google 翻譯沒有 KK 很不方便,所以就弄了一個

 

使用 XPath Helper 查看 Yahoo 字典 搜尋頁面

修正所有亂數產生的 @id 標籤,改使用數字

 

使用 Nuget 安裝 HtmlAgilityPack

取得 KK 的程式碼:

        private string GetKK(string keyword)
        {
            var url = $"https://tw.dictionary.search.yahoo.com/search?p={keyword}&fr=sfp";
            var web = new HtmlWeb();
            var doc = web.Load(url);
            var xPath =
                "/html[@id='Stencil']/body[@id='ysch']/div[@id='doc']/div[@id='bd']/div[@id='results']/div[@id='cols']/div[@id='left']/div[1]/div[@id='main']/div[1]/div[@id='web']/ol[1]/li[1]/div[1]/div[3]/ul[1]/li[1]/span[1]";

            var node = doc.DocumentNode.SelectSingleNode(xPath);
            return node.InnerText;
        }

根據功能,建立了一個視窗 :

 

print