6 标准库 - 6.5 UTF-8 支持 - 《Lua 5.3 参考手册》

除非另有说明，当一个函数需要一个字节位置的参数时，都假定这个位置要么从字节序列的开始计算，要么从字符串长度加一的位置算。和字符串库一样，负的索引从字符串末尾计起。

接收零或多个整数，将每个整数转换成对应的 UTF-8 字节序列，并返回这些序列连接到一起的字符串。

utf8.charpattern

返回一系列的值，可以让

迭代出字符串 s 中所有的字符。这里的 p 是位置（按字节数）而 c 是每个字符的编号。如果处理到一个不合法的字节序列，将抛出一个错误。

utf8.codepoint (s [, i [, j]])

返回字符串 s 中从位置 i 到 j 间（包括两端）UTF-8 字符的个数。默认的 i 为 1 ，默认的 j 为 -1 。如果它找到任何不合法的字节序列，返回假值加上第一个不合法字节的位置。

utf8.offset (s, n [, i])

返回编码在 s 中的第 n 个字符的开始位置（按字节数）（从位置 i 处开始统计）。负 n 则取在位置前的字符。当 n 是非负数时，默认的 i 是 1，否则默认为 #s + 1。因此，utf8.offset(s, -n) 取字符串的倒数第n 个字符的位置。如果指定的字符不在其中或在结束点之后，函数返回 nil。作为特例，当 n 等于 0 时，此函数返回含有 s 第 i 字节的那个字符的开始位置。