发表新帖

发表新帖

Strip HTML from strings in Python

前端未结

关注

 26  2338

难免孤独 2020-11-22 02:50

from mechanize import Browser
br = Browser()
br.open(\'http://somewebpage\')
html = br.response().readlines()
for line in html:
  print line

When p

26条回答

栀梦 (楼主)

2020-11-22 03:07
Here is a simple solution that strips HTML tags and decodes HTML entities based on the amazingly fast lxml library:
```
from lxml import html

def strip_html(s):
    return str(html.fromstring(s).text_content())

strip_html('Ein schöner Text.')  # Output: Ein schöner Text.
```
0 讨论(0)

查看其它26个回答
发布评论:

提交评论
- 加载中...

热议问题