ดาวไม่ได้ใช้งานดาวไม่ได้ใช้งานดาวไม่ได้ใช้งานดาวไม่ได้ใช้งานดาวไม่ได้ใช้งาน
 

             จากบทความ การใช้ตัวแปรดิคชันนารีเพื่อเก็บลิงค์และไตเติ้ลที่ได้จากการใช้งานโมดูลซิลิเนียม เราได้ทดลองการใช้การเก็บลิงค์และไตเติ้ลโดยใช้โมดูล Selenium (ซิลิเนี่ยม) และใช้ภาษาไพธอน กันไปบ้างแล้วในคราวนี้เราจะได้ลองกับเว็บอื่นๆบ้างๆซึ่งฟอร์มการเขียนโปรแกรมค่อนข้างคล้ายกันมากๆ 

 

กูเกิ้ลเสริช กับ โมดูล selenium (ซิลิเนียม)

              กูเกิ้ลเสริช คือเสริชเอ็นจิ้น ชนิดหนึ่งที่เราสามารถค้นหาสิ่งต่างๆที่เราต้องการได้ซึ่งถื่อว่าเป็นเสริชเอ็นจิ้นที่มีคุรภาพและผู้คนใช้งานกันอย่างมากมายและกว้างขวาง โดยในบทความนี้จะมาแนะนำหารใช้งานโมดูลซิลิเนียมกับกูเกิ้ลเสริชเอ็นจิ้น เพื่อเก็บลิงค์และไตเติ้ล ของสิ่งที่เราค้นหาทั้งหมด 

 

วิธีการเก็บลิงค์และไตเติ้ลในกูเกิ้ลเสริช โดยโมดูล selenium (ซิลิเนียม)

               1.เปิดหน้าเว็บและโครงสร้างหน้าเว็บที่เราต้องการเก็บลิงค์และไตเติ้ล   ในตัวอย่างจะเข้าถึงลิงค์และไตเติ้ลโดย XPath

 

               2.เขียนโปนแกรม

# -*- coding: utf-8 -*-
from selenium import webdriver
import time
driver = webdriver.Firefox(executable_path=r'C:\Users\BDC-CLUB\PycharmProjects\mdsoft\geckodriver.exe')
driver.get('https://www.google.com/') #เปิดหน้าเว้บที่ต้องการเก็บลิงค์และไตเติ้ล
a = driver.find_element_by_class_name('gsfi') #เข้าถึลงลิงค์และไตเติ้ลโดย XPath
a.send_keys("hello python")  #เสริชคำว่า "hello python"
a.submit()
time.sleep(3)
#xpath_topic= "//a[@class='topictitle']" #x path ของไตเติ้ล
xpath_topic= "//div//h3//a[@href]"
all_ids_topic = driver.find_elements_by_xpath(xpath_topic) #เก็บ sessionและelementไว้ในตัวแปร
print(all_ids_topic)
save_link = {} #กำหนดตัวแปรประเภาดิคชันนารี่
for i in all_ids_topic: #ลูปการเก็บลิงค์และไตเเติ้ล
    save_link[i.get_attribute('href')] = i.text
print(save_link) #ปริ้นไตเติ้ลและลิงค์

 

                 ผลการรัน:บรรทัดที่ 2 จะเก็บลิงค์และไตเติ้ลไว้

[<selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="4aa2c9a6-6f49-40e7-a899-c872a4f3e878")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="e96afca2-e233-43a9-b027-ac012d882b8c")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="edaad457-17ed-49e0-861e-2be6f9aa609a")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="aaa95ae7-b5f1-45d6-8d22-51cd4a6278dd")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="686a6a62-b4a1-4bf4-93af-ac3af47aee30")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="9d067a7b-1c89-41cf-8f19-ce43fd501a00")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="18082b58-c255-4dc1-931a-2e2f323edf13")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="9aedd82e-2b99-4139-8404-f9d896d88c4e")>, <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="be488680-fd78-415b-a63c-738e4b3cfa1d", element="4df559a5-6e0d-495c-9433-5d14b7958ca0")>]
{'https://www.learnpython.org/en/Hello,_World!': 'Hello, World! - Learn Python - Free Interactive Python Tutorial', 'https://www.programiz.com/python-programming/examples/hello-world': 'Python Program to Print Hello world! - Programiz', 'https://learnpythonthehardway.org/book/ex1.html': 'Exercise 1: A Good First Program - Learn Python the Hard Way', 'https://www.hackerrank.com/challenges/py-hello-world': 'Say "Hello, World!" With Python | HackerRank', 'https://www.amazon.com/Hello-Python-Anthony-S-Briggs/dp/1935182080': 'Hello! Python: Anthony S. Briggs: 0884771505755: Amazon.com: Books', 'https://www.guru99.com/creating-your-first-python-program.html': 'Hello World: Create your First Python Program - Guru99', 'https://www.digitalocean.com/community/tutorials/how-to-write-your-first-python-3-program': 'How To Write a Hello World Program in Python 3 | DigitalOcean', 'https://www.manning.com/books/hello-python': 'Manning | Hello! Python', 'https://www.kaggle.com/colinmorris/hello-python': 'Hello, Python | Kaggle'}
กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
การทำตัว Check Box ใน Google Sheets
โดย Chidchanok อ 22 ม.ค. 2019 12:22 pm บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
2
อ 22 ม.ค. 2019 12:22 pm โดย Chidchanok
[Extension phpBB3.1.1] Set forum width Extension เป็นการตั้งค่าความกว้างฟอรัม
โดย จันนุสรณ์ ดีแก่ อ 22 ม.ค. 2019 11:33 am บอร์ด phpBB 3.1 Extension Review
0
1
อ 22 ม.ค. 2019 11:33 am โดย จันนุสรณ์ ดีแก่
[Extension phpBB3.1.1] Activity Buttons - Quick Links Into Header Extension ปุ่มกิจกรรมต่างๆ
โดย จันนุสรณ์ ดีแก่ อ 22 ม.ค. 2019 10:49 am บอร์ด phpBB 3.1 Extension Review
0
4
อ 22 ม.ค. 2019 10:49 am โดย จันนุสรณ์ ดีแก่
R - Guide สำหรับ Migrate ข้อมูล
โดย tsukasaz จ 21 ม.ค. 2019 6:03 pm บอร์ด สิริกิตติรัตน์ - Developer
0
2
จ 21 ม.ค. 2019 6:03 pm โดย tsukasaz
ต้นเดือน Vs ปลายเดือน
โดย จันนุสรณ์ ดีแก่ จ 21 ม.ค. 2019 1:54 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
12
จ 21 ม.ค. 2019 1:54 pm โดย จันนุสรณ์ ดีแก่
ลายเซนต์คืออะไร การตั้งค่าข้อมูลส่วนตัว (แก้ไขลายเซนต์) วิธีการเพิ่มลายเซนต์
โดย จันนุสรณ์ ดีแก่ จ 21 ม.ค. 2019 11:42 am บอร์ด phpBB user Guide Knowledge
0
12
จ 21 ม.ค. 2019 11:42 am โดย จันนุสรณ์ ดีแก่
Bill of Material (BOM) คืออะไร
โดย ณัฐกฤตา บุญญะฤทธิ์ จ 21 ม.ค. 2019 11:38 am บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
10
จ 21 ม.ค. 2019 11:38 am โดย ณัฐกฤตา บุญญะฤทธิ์
[Extension phpBB3.1.1]Project Durango Extension เทมเพลสในรูปแบบสีเขียว
โดย จันนุสรณ์ ดีแก่ จ 21 ม.ค. 2019 11:02 am บอร์ด phpBB 3.1 Extension Review
0
11
จ 21 ม.ค. 2019 11:02 am โดย จันนุสรณ์ ดีแก่
[Extension phpBB3.1.1] Page Scrolling Extension ช่วยในการเลื่อนหน้า บนสุดและล่างสุด
โดย จันนุสรณ์ ดีแก่ จ 21 ม.ค. 2019 10:35 am บอร์ด phpBB 3.1 Extension Review
0
13
จ 21 ม.ค. 2019 10:35 am โดย จันนุสรณ์ ดีแก่
Q-ไม่สามารถ กด Save สินค้าได้
โดย Chidchanok จ 21 ม.ค. 2019 10:16 am บอร์ด M.D.Soft Co.,Ltd. - Tester
5
18
จ 21 ม.ค. 2019 11:07 am โดย Chidchanok
แก้ปัญหา ติดตั้ง โปรแกรมด้วย dpkg -i , apt-get deb
โดย mindphp จ 21 ม.ค. 2019 3:37 am บอร์ด Linux - Web Server
0
11
จ 21 ม.ค. 2019 3:37 am โดย mindphp
Manual (คู่มือ) คืออะไร Work Manual เเละ User Manual ต่างกันอย่างไร
โดย thatsawan จ 21 ม.ค. 2019 1:20 am บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
17
จ 21 ม.ค. 2019 1:20 am โดย thatsawan
รบกวนดูข้อผิดพลาดของการ login ให้หน่อยค่ะ
โดย Anonymous อ 20 ม.ค. 2019 7:32 pm บอร์ด Programming - PHP
2
43
จ 21 ม.ค. 2019 6:34 pm โดย aquanaan
TIP WITH RECURSIVE ดึงข้อมูล มาแสดง
โดย mindphp อ 20 ม.ค. 2019 5:24 pm บอร์ด PostgreSQL
0
6
อ 20 ม.ค. 2019 5:24 pm โดย mindphp
สรุปการเรียนรู้วิธีการใช้งาน php เว็บบอร์ด
โดย praphasri อ 03 ก.ค. 2018 3:12 pm บอร์ด phpBB user Guide Knowledge
0
5
อ 03 ก.ค. 2018 3:12 pm โดย praphasri
วิธีการคำนวณภาษีที่บริษัทออกให้
โดย praphasri จ 02 ก.ค. 2018 5:30 pm บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
12
จ 02 ก.ค. 2018 5:30 pm โดย praphasri
สรุปการเรียนรู้วิธีการใช้งาน google drive
โดย praphasri อ 03 ก.ค. 2018 3:05 pm บอร์ด Microsoft Office Knowledge & line & Etc
0
7
อ 03 ก.ค. 2018 3:05 pm โดย praphasri
R- mdsoft_siri_reciept_print (โมดูลปริ้น ใบเสร็จ)
โดย tatiya ส 19 ม.ค. 2019 8:49 pm บอร์ด สิริกิตติรัตน์ - Developer
2
5
อ 22 ม.ค. 2019 11:40 am โดย thatsawan
วิธีการทำ process bar ใน Google Sheets
โดย Chidchanok ส 19 ม.ค. 2019 8:16 pm บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
17
ส 19 ม.ค. 2019 8:16 pm โดย Chidchanok
Q-ไม่สามารถเข้าใช้งาน Open ERP ค่ะ
โดย Chidchanok ส 19 ม.ค. 2019 7:10 pm บอร์ด M.D.Soft Co.,Ltd. - Tester
3
18
จ 21 ม.ค. 2019 10:35 am โดย Chidchanok