PHP: 2007年11月アーカイブ
クライアントから文字コードUTF-8でメールフォームのページを作ってくれ、と言うことでPHPでざくっと制作。
セキュリティ上こちらはサーバにアクセスできないので、ファイルをあずけてアップロード~テストはクライアントに確認してもらい、OKが出たのでひとまずそのまま公開。
ところがしばらくして、日本語を送信すると文字化けするとのお知らせが入る。
まあmbstring系の問題だろう、とphp.iniの設定を依頼してもらったところこんな設定になっていましたと。
mbstring.language = Japanese
mbstring.internal_encoding = EUC-JP
mbstring.http_input = auto
mbstring.http_output = SJIS
mbstring.encoding_translation = On
PHPのマニュアルにも同じような設定が載っているので、おそらくそれに合わせたんじゃないかと思われますが、、
これではencoding_translationでパラメータがEUCに自動変換されちゃって、UTF-8を想定して書かれたコードでは化けるわけです。
コードの記述を制限してしまうencoding_translationなんて効かしておく必要ありますかね?
自動変換されるより、自分で文字コード意識しながら書いたほうがよっぽど分かりやすい。
結局、.htaccessを追加で上げてもらって、とりあえず文字化けは解決しました。
php_value mbstring.language Japanese
php_value mbstring.internal_encoding UTF-8
php_value mbstring.http_input pass
php_value mbstring.http_output pass
php_flag mbstring.encoding_translation Off
PHPのheader関数でページをリダイレクトさせようとしたところ、
"Warning: Cannot modify header information - headers already sent by ~"
のエラーが出てうまく処理がされません。
出力ヘッダに何かごみが入ってるのだろうとソースを探るも、どこにもそれらしき記述は一向に見当たらない。
<?php
header ("Location:http://www.hoge.com");
?>
気を取り直してこんな最小限のソースで動作確認を試みるも、それでもエラーは消えず。
こんなソースに何がいる!?
その後もいろいろと試行錯誤の末、文字コードをUTF-8にしている時に出るということにようやく気づきました。
私は開発にEmEditorを使用しているのですが、このソフトがUTF-8保存時にデフォルトで付けてくれているBOMが怪しいようです。
BOM無しで保存し直したら、今までの苦労がバカのようにあっさりとエラーは消えました。
BOMが付いていることでマークがテキストの先頭に必ず含まれるため、出力ヘッダに入り込んでしまっていたようです。
あまりにも不可解だったため、もうバッファで処理しようか、リダイレクトやめてページをincludeして済まそうかと何度も妥協しかけましたが、根本的解決にいたってスッキリしました。