HTMLの<pre>タグの中身の特殊文字を自動変換する

PHPでHTMLファイルを読み取り<pre>タグの中にある特殊文字を自動的にHTMLエンティティに変換するサンプルです。

自動変換のサンプル

<pre>タグの自動変換の使用用途はCMS(Content Management Saystem)などのシステムと限られていますが、使えそうだったら使ってみてください。

今回もこの手のものは関数にしています。言葉で説明するよりも実際のソースコードから読み取ってください。エレガントじゃないですが :-)

  // HTMLソースから<pre>～</pre>を取得する(pre_replace専用)
  function getPreTagArray($text,&$errmsg){
    
    // 文字列を配列にする :-)
    $list = preg_split("//u", $text, -1, PREG_SPLIT_NO_EMPTY);
          
    $target_tag   = "";     // 対象タグ      
    $lessthan_flg = false;  // < フラグ
    
    $st_pretag_count = 0;   // <pre>開始タグの個数(</pre が出現するまで)
    $en_pretag_count = 0;   // <pre>終了タグの個数     
    $preTag_pos      = -1;  // <pre>の開始位置

    $tmplist = array();
        
    $length = count($list); 
    for($i=0;$i<$length;$i++){
      
      if ($list[$i] === '<') {
        $lessthan_flg = true;
        $target_tag  .= $list[$i];
        continue;          
      }

      if ($list[$i] === '>') {   
        $target_tag .=  $list[$i];
          
         
        // 開始タグ
        if ((mb_strpos($target_tag,"<pre",0,"UTF-8") === 0) ||  // FALSEではない(文字列の開始位置)
            (mb_strpos($target_tag,"<PRE",0,"UTF-8") === 0)){   
        
          // 最初のタグの位置を取得  
          if ($st_pretag_count == 0){
            $preTag_pos = ($i+1) - mb_strlen($target_tag,"UTF-8"); 
          }
          $st_pretag_count++;                        
        }          
       
        // 終了タグ
        if (($target_tag === '</pre>') || ($target_tag === '</PRE>')){ 
        
          $en_pretag_count++;
          
          // 同じ回数ならばリストへ
          if($st_pretag_count == $en_pretag_count){
             $tmplist[] = mb_substr($text,$preTag_pos,($i+1)-$preTag_pos,"UTF-8");
             $preTag_pos      = -1;
             $st_pretag_count = 0;
             $en_pretag_count = 0;                 
          }
        }     

        // 初期化
        $lessthan_flg = false;
        $target_tag   = "";
      }   
      
      // 対象タグの保存
      if ($lessthan_flg){
          $target_tag .=  $list[$i];
      }     
    }      
    
    // 文法エラー
    if ($st_pretag_count !== $en_pretag_count){
      $errmsg =  "構文エラー：&lt;pre&gt;&lt;/pre&gt;の「はじまり」と「おわり」のタグ数が一致しません。";
      return NULL;
    } 
    
    // リストの生成
    $result = array(); 
    for($i=0;$i<count($tmplist);$i++){        
      // *** RAWデータ
      $result[$i]['raw'] = $tmplist[$i];                
      $wrk_pos = mb_strpos($tmplist[$i],'>',0,"UTF-8");
      // *** PREタグ(前)
      $result[$i]['start'] = mb_substr($tmplist[$i],0,$wrk_pos+1,"UTF-8");
      // *** PREタグの中身   
      $result[$i]['body']  = mb_substr($tmplist[$i],$wrk_pos+1,mb_strlen($tmplist[$i],"UTF-8") -
                                                               mb_strlen($result[$i]['start'],"UTF-8") -
                                                               mb_strlen("</ore>","UTF-8"),
                                                              "UTF-8");  
      // *** PREタグ(後)
      $result[$i]['end']   = '</pre>'; 
      
    }
    
    return $result;
  }
                    
  // HTMLソース内の<pre>～</pre>の特殊文字をHTMLエンティティに変換する
  // ※<pre>タグの入れ子にも対応しています。(例)<pre>a<pre>b</pre>c</pre>
  // ※HTMLタグの構文が正しい場合のみ動作します。(推奨：この関数を実行する前にHTMLタグの構文チェックをする)
  function pre_replace($text,&$errmsg){
   
    $result = $text;
    
    if((mb_strpos($result,"<pre",0,"UTF-8") === FALSE) &&
       (mb_strpos($result,"<PRE",0,"UTF-8") === FALSE))      
      return $result;
    else{ 
      
      if((mb_strpos($result,"</pre>",0,"UTF-8") === FALSE) &&
         (mb_strpos($result,"</PRE>",0,"UTF-8") === FALSE)){
        $errmsg =  "構文エラー：&lt;pre&gt;&lt;/pre&gt;の「はじまり」と「おわり」のタグ数が一致しません。";
        return NULL;
      }   
         
      // HTMLソースから<pre>～</pre>を取得する
      $list = getPreTagArray($result,$errmsg);

      if ($errmsg != "") return NULL;
      
      // <PRE>タブ内の特殊文字を置換する
      for ($i=0;$i<count($list);$i++){
        $result = str_replace($list[$i]['raw'],
                              $list[$i]['start']. htmlspecialchars($list[$i]['body']) . $list[$i]['end'],
                              $result);
      }
      return  $result ;
    }
  }

[使い方]

ソースをコピー

echo pre_replace("変換したいHTMLソース",$errmsg);

戻り値には変換されたHTMLソースが設定されます。エラーがある場合には戻り値はNULLで$errmsgにエラーメッセージが設定されます。

※<pre>タグの入れ子にも対応した為、コード内に構文上、誤りがある<pre></pre>があるとエラーが発生する場合がありますのでご了承下さい。その場合は、手動でhtmlspecialchars()を使用して特殊文字を変換して下さい。

Pocket
LINE

前の記事：	重複しないランダムの値を取得する
次の記事：	ブラウザでファイルをドラッグ＆ドロップ

公開日：2014年12月18日

記事NO：00037

プチモンテ ※この記事を書いた人


	💻 ITスキル・経験サーバー構築からWebアプリケーション開発。IoTをはじめとする電子工作、ロボット、人工知能やスマホ/OSアプリまで分野問わず経験。画像処理/音声処理/アニメーション、3Dゲーム、会計ソフト、PDF作成/編集、逆アセンブラ、EXE/DLLファイルの書き換えなどのアプリを公開。詳しくは自己紹介へ
🎵 音楽制作 BGMは楽器(音源)さえあれば、何でも制作可能。歌モノは主にロック、バラード、ポップスを制作。歌詞は抒情詩、抒情的な楽曲が多い。楽曲制作は🔰2023年12月中旬～

オリジナル曲を始めました✨

妖精のオルゴール feat. 情熱さん (2025/12/9 新曲)

Webアプリ

このブログのマスターが作成した無料ツールです。

Free 疾風 - ときかぜ - (オープンソース)
ブラウザで写真などの画像を編集する

Free PDFデザイナー (オープンソース)
ブラウザでPDFファイルを編集(結合、分割、抽出、回転、しおり等)する

Free 複数画像のPDF変換
ブラウザで複数の画像を1つのPDFファイルにまとめる

Free PDFのテキスト変換
ブラウザでPDFファイルをテキストに変換する

Free PDFの画像変換
ブラウザでPDFファイルを画像に変換する

Free Exifの確認と削除 (オープンソース)
カメラで撮影した画像ファイル(JPEG)に潜むGPSなどのExif情報を確認、削除する (ブラウザ/スマホ対応)

Free エクセルのCSV変換
ブラウザでエクセルをCSVに変換する(一括変換も可能)

Free GIFアニメの作成 (オープンソース)
ブラウザで画像からGIFアニメを作成する

Free 動画のGIFアニメ変換
ブラウザで動画ファイルをGIFアニメへ変換する

Free アイコンエディタ
ブラウザでアイコンを作成、読み込み、編集する

Free 複数画像のAVI変換 (オープンソース)
ブラウザで画像/音声を動画ファイル(AVI)に変換する

Free Webカメラ動画変換
ブラウザで映像/音声を動画ファイル(AVI)に変換する

Free 音声形式の変換 (オープンソース)
ブラウザでMP3/OGG/AAC/FLAC/WAVなどの音声ファイルをWaveファイルに変換する

Free Waveファイルで効果音作成 ♪
ブラウザでWaveファイルの効果音を作成する

Free Waveフォーマット変換 (オープンソース)
ブラウザで8/16/24/32bitの相互変換。サンプリング周波数、チャンネルを変更する

Free 音声の結合 / 抽出 / 削除 (オープンソース)
ブラウザでWaveファイルを結合、抽出、削除する

Free Waveファイルの解析 (オープンソース)
ブラウザで全体の波形、再生時間、ビットレート、WaveFomat構造体を解析して表示する

Free 波形データと周波数スペクトル
ブラウザでマイクやパソコン内で流れている音声、MP3/OGG/WAVなどのファイルの周波数を解析する

Free 双2次フィルタ(BiquadFilter)
ブラウザで音声の特定周波数をカット/増幅/減衰する

Free 絶対音感
ブラウザでマイクやパソコン内で流れている音声のドレミなどの音階をリアルタイムに表示する (スマホ対応)

Free 音声録音くん
ブラウザでマイクやパソコン内で流れている音声をMP3/WAVE形式で保存する

Free iResEditor (オープンソース)
ブラウザでEXE/DLLファイルのリソースを編集する

Free Webの逆アセンブラ
ブラウザでEXE/DLLファイルを逆アセンブルする

※その他にも「プチラボ」でアプリを多数公開しています。

3Dゲーム

このブログのマスターが作成した無料ゲームです。

短時間で遊べるファンタジーのオンラインRPG風

ほのぼの癒し系のスマホアプリ

パズルゲーム

ナンプレのドン！

スマートフォン

このブログのマスターが作成したアプリです。

お主の画像減色
カメラの写真や画像ファイルを「高品質に減色」する

お主は誰だ。
AI(人工知能)が「あなたの顔はどんな芸能人、有名人に似てるか」を判定する顔診断アプリ (女性向け)

AI(人工知能)

おもちゃのAI研究室
イラストの自動着色などのAIアプリの研究室(学習用)

めえめえ(自動作曲システム)
ブラウザで歌詞を入力するだけで自動作曲する(簡易版)
※オリジナルの作詞・作曲はYouTubeで公開中

ロボット

このブログのマスターが作成したロボットです。(試作機)

ロボットアーム

二足歩行ロボット

四足歩行ロボット

1位	BootstrapのPaginationをレスポンシブに対応する [Laravel]
2位	SQLSTATE[42000]: Syntax error or access violation: 1055 [Laravelのエラー]