My string is Niệm Bồ Tát (Thiá»n sÆ° Nhất Hạnh) and I want to decode it to Niệm Bồ Tát (Thiền sư Nhất Hạnh). I see in that site can do that ht
Niệm Bồ Tát (Thiá»n sÆ° Nhất Hạnh)
Niệm Bồ Tát (Thiền sư Nhất Hạnh)
I'm not sure what you can do with these kind of data, but for your example in your original post, this works:
>>> mystr = '09. Bát Nhã Tâm Kinh' >>> s = mystr.decode('utf8').encode('latin1').decode('utf8') >>> s u'09. B\xe1t Nh\xe3 T\xe2m Kinh' >>> print(s) 09. Bát Nhã Tâm Kinh