python如何实现网页爬取,并翻译成中文

您所在的位置:网站首页 网站是英文怎么变成中文 python如何实现网页爬取,并翻译成中文

python如何实现网页爬取,并翻译成中文

2024-07-11 06:00| 来源: 网络整理| 查看: 265

曾经有个想法,是否可以通过抓取英语新闻,来做一个国人看得懂的国际新闻资讯APP,如今闲暇之余,实现了。

简单而快乐。

现贴出代码分享给你们,做个参考 

import io import sys import urllib.request from lxml import etree from googletrans import Translator sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码 url = '外文网页' res = urllib.request.urlopen(url) htmlBytes=res.read() html = htmlBytes.decode('utf-8') tree = etree.HTML(html) title = tree.xpath('//h1[@class="post__title"]/a/text()') # 获取标题 result = tree.xpath('//article[@class="post__article "]//text()') # 获取内容 # 内容提取,按照英文句号 content = [] str = '' for x in result: str += x; if '.' in x: content.append(str) str='' pass translator = Translator(service_urls=[ 'translate.google.cn' ],timeout=None) res = translator.translate(content,dest='zh-cn',src='en') # 输出翻译好的中文 for i in res: print(i.text)

每天进步一点点,加油

                                                                                                                                              ---我是bingo,码路漫漫,且行且珍惜



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3