unicode转化为汉字

unicode转化为汉字

使用node爬虫经常碰到unicode编码的汉字

十六进制(&#x开头)

1
unescape(string.replace(/&#x/g,'%u').replace(/;/g,''))

十进制((&#开头)

1
2
3
4
5
function decode(s) {
return s.replace(/&#(\d+);?/g, function (_, $1) {
return unescape(($1 > 1000 ? '%u' : '%') + parseInt($1).toString(16))
})
}