excel中无法去除的空格,可能是不明不可见字符

作者:彼岸花开 | 创建时间: 2023-05-01
手动拷贝或使用爬虫获取的网络文本,粘贴/写入到Excel中以后,在进行统一格式化的过程中,经常会发现明明字符串一模一样,却无法用公式正确匹配判断。 这时候,需要做的是,先检查Excel中是否有“神秘的”不可见字符。...
excel中无法去除的空格,可能是不明不可见字符

操作方法

Excel中,针对从网络复制过来的文本,在进行处理的时候,如果发现明明文本一模一样,却怎么也无法匹配上,很可能是因为这个文本的末尾有不可见非空格字符。 如图,示例中,部分文本前面的空格,不论是通过替换,还是trim,或者用clean去除不可打印字符,都还是无法去除。

这时候,检查空格字符的代码(使用code函数),可以发现,可以删除的空格是32,而其他不可去除的空格都是不是32。 ASCII码中,32代码的是space(即按空格键产生的空格)。

可以看到,有很多种不同的不可见字符,并非只有空格。而网络文本由于编码方式的不同,复制到excel中非常可能产生乱码及其他问题。

如果要去除网络文本中的这些不可见字符,一个方法是找到这些字符,然后复制到公式或替换>查找内容中进行替换,因为来源相同的网络文本一般只会包含有限种类的不可见字符。

点击展开全文

更多推荐