FUKS
Зарегистрирован: 14.04.2002 Сообщения: 148 Откуда: Москва
|
Добавлено: Чт Фев 17 2005 15:06 Заголовок сообщения: Re: сторка в unicode на перле |
|
|
Вот так должно работать:
Код: |
sub W2U { # Вспомогательная суба, перекодирует один символ
($c)=@_;
$c=~s/Ё/pack("cc",208,129)/e or
$c=~s/ё/pack("cc",209,145)/e or
$c=~s/[А-п]/pack("cc",209,ord($c)-48)/e or
$c=~s/[р-я]/pack("cc",208,ord($c)-112)/e;
$c
}
sub trW2U { # Рабочая функция, перекодирует список строк
~s/[А-П]/&W2U($&))/ge foreach @_
}
|
А если пошустрее надо, то лучше просто табличное преобразование делать. Но это только перекодировка символов, а в уникодовом файле в начале ещё сигнатура стоит: \xEF\xBB\xBF - может тоже понадобится.
Можно конечно воспользоваться стандартным модулем для этого дела, но я не знаю каким и как, лень искать 8-) |
|