`

AbstractStringBuilder 类的 reverse 方法分析

阅读更多

说明:这段代码很有意思,它考虑到了 Unicode 的情况,我们如何写反转的话,两头循环,然后交换. 但是这只做了第一步,而 JDK源码中,它考虑到了还原 Unicode 的情况.

/**
     * 导致此字符序列被序列的反序替换. 如果序列中包含任何代理对,则将这些代理对视为反向操作的单个字符.
     * 因此,高低代理人的顺序永远不会逆转.(也就是说,这个方法将代码点当成了一个整体.)
     *
     * 在执行 reverse 方法之前,让 n 成为此字符序列的字符长度(不是 char 值中的长度).
     * 然后,新字符序列中索引 k 处的字符等于旧字符序列中索引 n-k-1 处的字符.
     *
     * 请注意,反向操作可能导致在操作之前产生代表对,即未配对的低代理和高代理.
     * 例如,反转“\ uDC00 \ uD800”会生成“\ uD800 \ uDC00”,这是一个有效的代理项对.
     *
     * @return  a reference to this object.
     */
    public AbstractStringBuilder reverse() {
        //是否含代理字符
        //高代理highSurrogate和低代理lowSurrogate概念请另查询char与Unicode字符
        boolean hasSurrogate = false;
        //定义一个变量表示长度-1
        int n = count - 1;
        //j初始化,长度-2再算术右移一位 j = (count-2)/2
        //偶数长度,遍历一半次数,对调替换
        //奇数长度,遍历一半-1次数,对调替换,中间值不用替换
        for (int j = (n-1) >> 1; j >= 0; --j) {
            char temp = value[j];
            char temp2 = value[n - j];
            //如果无代理
            if (!hasSurrogate) {
                hasSurrogate = (temp >= Character.MIN_SURROGATE && temp <= Character.MAX_SURROGATE)
                    || (temp2 >= Character.MIN_SURROGATE && temp2 <= Character.MAX_SURROGATE);
            }
            value[j] = temp2;
            value[n - j] = temp;
        }
        if (hasSurrogate) {
            // Reverse back all valid surrogate pairs
            // 反转回所有有效代理对
            // 高代理+低代理组合表示一个字符.
            for (int i = 0; i < count - 1; i++) {
                char c2 = value[i];
                // 这个方法就是把代码点的顺序调整对.
                if (Character.isLowSurrogate(c2)) {
                    char c1 = value[i + 1];
                    if (Character.isHighSurrogate(c1)) {
                        value[i++] = c1;
                        value[i] = c2;
                    }
                }
            }
        }
        return this;
    }
1
0
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics