比较文本

查找两个文本文件之间的差异

实时编辑器

折叠未更改行

关闭换行

视图

比对精度

语法高亮

Diffchecker Desktop 运行Diffchecker最安全的方式。获取Diffchecker桌面应用：您的差异永远不会离开您的电脑！获取桌面版

3주차 과제 비교

创建于 4年前差异永不过期

12 删除

行
总计
删除

字符
总计
删除

要继续使用此功能，请升级到 Diffchecker Pro 查看价格

15 行

25 添加

行
总计
添加

字符
总计
添加

要继续使用此功能，请升级到 Diffchecker Pro 查看价格

29 行

## 웹 크롤링에 필요한 세팅: requests와 bs4 패키지

import requests

from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}

data = requests.get('https://www.genie.co.kr/chart/top200?ditc=M&rtm=N&ymd=20210701',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

trs = soup.select('#body-content > div.newest-list > div > table > tbody > tr')

## 지니뮤직의 1~50위 곡의 순위/곡명/가수를 스크래핑해보자

# 순위

#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.number

# 곡명

#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.info > a.title.ellipsis

# 가수

#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.info > a.artist.ellipsis

# 공통부분:

#body-content > div.newest-list > div > table > tbody > tr

for tr in trs:

title = tr.select_one('td.info > a.title.ellipsis').text.strip()

# 최종 정리:

rank = tr.select_one('td.number').text[0:2].strip()

musics = list(soup.select("#body-content > div.newest-list > div > table > tbody > tr"))

artist = tr.select_one('td.info > a.artist.ellipsis').text

for music in musics:

rank = music.select_one("td.number").text[:2].replace('\n', ' ')

title = music.select_one("td.info > a.title.ellipsis").text.strip()

artist = music.select_one("td.info > a.artist.ellipsis").text.strip()

print(rank, title, artist)

已保存差异

原始文本

打开文件

更改后文本

打开文件

## 웹 크롤링에 필요한 세팅: requests와 bs4 패키지
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://www.genie.co.kr/chart/top200?ditc=M&rtm=N&ymd=20210701',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')

## 지니뮤직의 1~50위 곡의 순위/곡명/가수를 스크래핑해보자
# 순위
#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.number
# 곡명
#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.info > a.title.ellipsis
# 가수
#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.info > a.artist.ellipsis
# 공통부분:
#body-content > div.newest-list > div > table > tbody > tr

# 최종 정리:
musics = list(soup.select("#body-content > div.newest-list > div > table > tbody > tr"))
for music in musics:
    rank = music.select_one("td.number").text[:2].replace('\n', ' ')
    title = music.select_one("td.info > a.title.ellipsis").text.strip()
    artist = music.select_one("td.info > a.artist.ellipsis").text.strip()

print(rank, title, artist)