หลังจากที่เราได้ศึกษาการใช้งานภาษา Python ไพทอน จากบทความต่างๆ เช่น ตัวแปรชนิดดิกชันนารี ใน ไพทอน Python Dictionary Data type , ตัวแปร และ คำสงวน ในภาษา Python ไพทอน และ แปลข้อความจากภาษาอังกฤษเป็นเป็นภาษาไทยโดยกูเกิ้ลแปลภาษา ด้วยโมดูลซิลิเนียม
ฟังชั่นบิ๊วอินของตัวแปรเซต ในภาษาไพธอน
เซตในทางคณิตศาสตร์ เราอาจจะมองได้ว่าเป็นการรวบรวมกลุ่มของวัตถุต่างๆ ไว้รวมกันทั้งชุด ความคิดนี้จะดูง่ายๆ แต่เซตเป็นแนวคิดที่เป็นรากฐานสำคัญที่สุดอย่างหนึ่งของคณิตศาสตร์สมัยใหม่ การศึกษาโครงสร้างเซตที่เป็นไปได้ ทฤษฏีเซตมีความสำคัญและได้รับความสนใจอย่างมากและกำลังดำเนินไปอย่างต่อเนื่อง ในภาษาไพธอนนั้นก็มีฟังก์ชั่น built-in (บิ๊วอิน) สำหรับเซตด้วยเพื่ออำนวยคำวามสะดวกแก่การเขียนโปรแกรมในภาษาไพธอน ในบทความนี้จะมาแนะนำการอินเตอร์เซคชั่น ซึ่งก็คือ การนำเซตมาเปรียบเทียบกันแล้วพิจารณาตัวที่เหมือนกัน
การใช้ intersection (อินเตอร์เซคชั่น) ประยุกต์ใช้กับ โมดูล selenium (ซิลิเนียม)
เขียนโค้ดดังนี้
from selenium import webdriver
from pythainlp import word_tokenize
import time,random,re
driver = webdriver.Firefox(executable_path=r'C:\Users\BDC-CLUB\PycharmProjects\mdsoft\geckodriver.exe')
driver.get("http://www.mindphp.com/online-tools/tags.html")
search = driver.find_element_by_id("filter-search")
search.send_keys("data") #ใส่คำไปในเว็บ
search.submit() #ใส่คำเสร็จไปเเสริช
time.sleep(3)
ids = driver.find_elements_by_xpath("//*[@id='adminForm']/ul/li/div/a")#เก็บ idsของtags
ids_list = [] #เก็บกลุ่มข้อความลงตัวแปร
for i in ids:
ids_list.append(i.text)
print(ids_list)
driver.get("http://www.mindphp.com/online-tools/tags.html")
search = driver.find_element_by_id("filter-search")
search.send_keys("type") #ใส่คำไปในเว็บ
search.submit() #ใส่คำเสร็จไปเเสริช
time.sleep(3)
ids2 = driver.find_elements_by_xpath("//*[@id='adminForm']/ul/li/div/a")#เก็บ idsของtags
ids_list2 = [] #เก็บกลุ่มข้อความลงตัวแปร
for i in ids2:
ids_list2.append(i.text)
print(ids_list2)
ids_list = set(ids_list) #แปลงตัวแปรลิสต์เป็นเซต
ids_list2 = set(ids_list2)
a = ids_list.intersection(ids_list2) #นำข้อมูล 2 ตัวมาเปรียบเทียบกัน แล้วเลือกตัวที่เหมือนกันออกมา
print(a)
ผลการรัน:บรรทัด1 คือข้อมูลชุดแรก บรรทัด2 คือข้อมูลชุด2 และบรรทัด3 คือการอินเตอร์เซตชั่นกันระหว่างข้อมูลทั้ง 2 ชุด
['Big data', 'data center', 'Data Communications', 'data model', 'Data Processing', 'Data structure', 'Data-Transfer', 'Database', 'Database Server', 'DataType']
['DataType', 'Mime Type', 'prototype', 'USB Type C']
{'DataType'}
ข้อมูลชุดแรกจากหน้าเว็บ
ข้อมูลชุดที่2 จากหน้าเว็บ
อ้างอิง: วิกิพีเดีย