<?xml version="1.0" encoding="windows-1252"?>
<node id="1005553" title="How to remove other language character from a string" created="2012-11-26 00:11:44" updated="2012-11-26 00:11:44">
<type id="115">
perlquestion</type>
<author id="961">
Anonymous Monk</author>
<data>
<field name="doctext">
Hi,
&lt;p&gt;
I want to remove all the other languages from my sentence and grep only English alphabet.
&lt;/p&gt;
e.g : &amp;#3588;&amp;#3619;&amp;#3633;&amp;#3623;&amp;#3595;&amp;#3629;&amp;#3591;&amp;#3648;&amp;#3648;&amp;#3595;&amp;#3609;&amp;#3604;&amp;#3660;&amp;#3623;&amp;#3636;&amp;#3594;&amp;#3652;&amp;#3586;&amp;#3656;&amp;#3604;&amp;#3634;&amp;#3623; Croissant Egg Sandwich &amp;#3588;&amp;#3619;&amp;#3633;&amp;#3623;&amp;#3595;&amp;#3629;&amp;#3591;&amp;#3648;&amp;#3648;&amp;#3595;&amp;#3609;&amp;#3604;&amp;#3660;&amp;#3623;&amp;#3636;&amp;#3594;&amp;#3652;&amp;#3586;&amp;#3656;&amp;#3604;&amp;#3634;&amp;#3623;
&lt;p&gt;
Assuming this as an example,my code is like this :
&lt;code&gt;
$image ='&amp;#3588;&amp;#3619;&amp;#3633;&amp;#3623;&amp;#3595;&amp;#3629;&amp;#3591;&amp;#3648;&amp;#3648;&amp;#3595;&amp;#3609;&amp;#3604;&amp;#3660;&amp;#3623;&amp;#3636;&amp;#3594;&amp;#3652;&amp;#3586;&amp;#3656;&amp;#3604;&amp;#3634;&amp;#3623; Croissant Egg Sandwich &amp;#3588;&amp;#3619;&amp;#3633;&amp;#3623;&amp;#3595;&amp;#3629;&amp;#3591;&amp;#3648;&amp;#3648;&amp;#3595;&amp;#3609;&amp;#3604;&amp;#3660;&amp;#3623;&amp;#3636;&amp;#3594;&amp;#3652;&amp;#3586;&amp;#3656;&amp;#3604;&amp;#3634;&amp;#3623;';
$image =~s/\p{Thai}//;
print $image;
&lt;/code&gt;
But the output is the same string, I want only 'Croissant Egg Sandwich' as output. Please help me out in this.
&lt;/p&gt;</field>
<field name="reputation">
11</field>
</data>
</node>
