PHP正規表現での質問です。 preg_match_allを使って機種依存文字...

結局範囲指定でやると抜けがかなり多かったから、こうなった↓

'([①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑯⑰⑱⑲⑳ⅠⅡⅢⅣⅤⅥⅦⅧ
ⅨⅩ㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡㍻〝〟
№㏍℡㊤㊥㊦㊧㊨㈱㈲㈹㍾㍽㍼∮∟⊿硃硎硏硑硨确碑碰𥔎碭磤
磲礀磷礜礮礱礴社祉祅祆祈祐祖祜祝神祥祹禍禎福禘禱禸秈秊𥝱
秔秞秫秭稃穀稹穝穭突窅窠𥧄窳窻竎竫竽笒笭笻筇筎筠筭筯筲箞
節篗篙簁簱簞簠簳簶䉤𥶡籙籭籹粏粔粠粼糕糙糝紇紈紓紝紣紱絁
絈絓絜絺綃綋綠綦緂緌緖緣練縨縈縑縕繁繇繒繡纊纍罇署羑羗羿
翎翛翟翬翮翺者耔耦耵耷耼胊胗胠胳脘腊腠腧腨腭膻臊臏臗臭䑓
䑛艠艴𦫿芎芡芣芤芩芮芷芾芿苆苕苽苾茀茁荢茢茭茺荃荇荑荕荽
莆莒莘莧莩莿菀菇菏菑菡菪萁萆萊著葈葟葰葳蒅蒞蒯蒴蒺蓀蓂𦹀
蔲蔞蔣蔯蕙蕤﨟薭蕺薌薏薢藋藎藭蘒藿蘄蘅蘐𧃴蘘蘩蘸虗虛虜虢
䖝虬虵蚘蚸蛺蛼蛽蜋蝱螇螈螬螭螵䗪蟖蟬蠆蠊蠐蠔蠟袘袪裊裎𧚄
裵褜褐褘褙褚褧褰褲褹襀覔視觔觥觶訒訕訢訷詇詎詝詡詵詹誧諐
諟諴諶諸謁謹譆譔譙譩讝豉豨賓賡賴賸賾贈贒贛趯跎跑跗踠踣踽
蹰蹻𨉷軀䡄軺輞輭輶轔𨏍辦辵迤迨迮逈逭逸邈邕邗邙邛邢邳邾郄
郅郇郗郝郞郯郴都鄔鄕鄖鄢鄯鄱鄴鄽酈酛醃醞醬醱¬釗釻釤]' //依存文字
.')';


囲み数字とローマ数字など13区あたりと、化け漢字を並べた結果。
ここは問答無用で散れ!と指定。


で、さらに

'('
.'\∅|\∉|\∗|\≅|\⊄|\⊕
|\⊗|\⋅|\⌈|\⌉|\⌊|\⌋|\⟨
|\⟩|\♠|\♣|\♥|\♦'
//HTML特殊文字だけど依存文字
.')';


特殊文字だけどスペードとかは化けるから散れ!っていう表現。


んで、しかも(長いよ)

'('
.'[‰§¨°¶¬±∀∃∂∇∈∋�槇紜隋腆棧腹泡羨摺蕁茵癶瓣匠植滋�
⊥ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδ
εζηθικλμνξοπρστυφχψω]' //そのまま書くと依存文字
.')';

HTML特殊文字コードにすれば使えますよー、な記号は注意を促したり。


基本的にWINとMACでしか見てないので、おそらくUNIでの依存やらはまだあると思うけど。
やっぱUNIとかLINUXとかインストしてチェックしないとわからないなぁ…
エミュレとかないのかな???無理か…

今回は別にそこまでこる必要ないしOKではあるけど。


PHP正規表現での質問です。 preg_match_allを使って機種依存文字を探し出しすコードを書いているのですが、うまくいきません。 下のものではうまくいくのですが、例えば"ユユ"という文字を$dddに入れると、 ユのコードが8386なので83「8683」86で反応するようです。 http://q.hatena.ne.jp/1189143057←ここと同じです。 やはりmbを使ったり文字を全部並べたりしたり…無理やりでないと難しいでしょうか? できれば\x○○の形で頑張りたいのですが… 何かアドバイスをもらえると助かります。 ※SJISなのにSJISでエンコしてるのはEUCも試したときの名残なので無視してください… コード↓ =====