CORE
HOME > JAVA > J2SE > CORE
2010.12.23 / 14:37

¾Æ½ºÅ°ÄÚµå(ASCII), À¯´ÏÄÚµå(UNICODE), À¯´ÏÄÚµåÀÇ ÀÎÄÚµù(UTF-8, EUC-KR, MS949, ISO-8859..)

Ȳº¸°ß¼ö
Ãßõ ¼ö 266
Á¦¸ñ¾øÀ½ ¾Æ½ºÅ°ÄÚµå(ASCII)
¾Æ½ºÅ°(ASCII, American Standard Code for Information Interchange, ¹Ì±¹ Á¤º¸ ±³È¯ Ç¥ÁØ ºÎÈ£)
¿µ¹® ¾ËÆĺªÀ» »ç¿ëÇÏ´Â ´ëÇ¥ÀûÀÎ ¹®ÀÚ ÀÎÄÚµù, ÄÄÇ»ÅÍ¿Í Åë½ÅÀåºñ¸¦ ºñ·ÔÇÑ ¹®ÀÚ¸¦ »ç¿ëÇÏ´Â ¸¹Àº ÀåÄ¡¿¡¼­ »ç¿ë
1967³â¿¡ Ç¥ÁØÀ¸·Î Á¦Á¤µÇ¾î 1986³â¿¡ ¸¶Áö¸· °³Á¤ÀÌ µÇ¾úÀ½.
1Byte·Î Ç¥ÇöµÇ°í, ºñÆ®·Î´Â 10Áø¼ö 0~255 ·Î Ç¥½ÃÇÒ ¼ö ÀÖ´Ù.
(ÄÄÇ»ÅͶó´Â °Ô ±º»ç¿ëÀ¸·Î¼­ ¸ÕÀú »ç¿ëµÇ¾úÀ¸´Ï ÀÌ ¶ÇÇÑ ±× ¿ëµµ °ÚÁö¿ä? ¹Ì±¹»ç¶÷µé ÀÔ¸À¿¡ ¸Â°Ô Ç¥ÁØÀ» Á¤Çß´Ù°í º¼ ¼ö Àִµ¥ ÀÌ·± °Í º¸¸é °­´ë±¹ÀÌ ±¦È÷ °­´ë±¹ÀÌ ¾Æ´Ï¶õ »ý°¢ÀÌ µå³×¿ä.)



À¯´ÏÄÚµå (UNICODE)
Àü ¼¼°èÀÇ ¸ðµç ¹®ÀÚ¸¦ ÄÄÇ»ÅÍ¿¡ ÀÏ°üµÇ°Ô Ç¥ÇöÇÏ°í ´Ù·ê ¼ö ÀÖµµ·Ï ¼³°èµÈ »ê¾÷ Ç¥ÁØ
À¯´ÏÄÚµå Çùȸ°¡ Á¦Á¤Çϸç, ÃÖ½ÅÆÇÀº 2009³â 10¿ù¿¡ °ø°³µÈ À¯´ÏÄÚµå 5.2 ÀÌ´Ù.
À¯´ÏÄÚµåÀÇ ¸ñÀûÀº ÇöÁ¸ÇÏ´Â ¹®ÀÚ ÀÎÄÚµù ¹æ¹ýµéÀ» ¸ðµÎ À¯´ÏÄÚµå·Î ±³Ã¼ÇÏ·Á´Â °ÍÀÌ´Ù.
±âÁ¸ÀÇ ÀÎÄÚµùµéÀº ±Ô¸ð³ª ¹üÀ§¸é¿¡ ÇÑÁ¤µÇ¾î ÀÖ°í, ´Ù±¹¾î ȯ°æ¿¡¼­´Â ¼­·Î ȣȯµÇÁö ¾Ê´Â ¹®Á¦Á¡ÀÌ ÀÖ¾ú´Ù.
À¯´ÏÄڵ尡 ´Ù¾çÇÑ ¹®ÀÚ ÁýÇÕµéÀ» ÅëÇÕÇÏ´Â µ¥ ¼º°øÇϸ鼭 ³Î¸® »ç¿ëµÇ°Ô µÇ¾ú´Ù.
ÀÌÇØÇϱâ ÆíÇÏ°Ô ¸»Çؼ­ ¼¼°è ¸ðµç ¹®ÀÚ¸¦ 0¹ø ºÎÅÍ ÂÞ¿í ~ ¹øÈ£¸¦ Á¤Çؼ­ ¸¸µç ÁýÇÕü ¶ó°í º¸½Ã¸é µË´Ï´Ù.
0000~ ºÎÅÍ ½ÃÀÛ Basic Latin, ÇѱÛÀº AC00 ºÎÅÍ ½ÃÀÛ ÇÕ´Ï´Ù. Âü°í (http://rudhar.com/lingtics/uniclnkl.htm)
pdfÆÄÀÏ·Î ´Ù¿î ¹ÞÀ¸½Ç ¼ö ÀÖ½À´Ï´Ù.
(À¯´ÏÄÚµå·Î¼­ ¼¼°èÀÇ ¸ðµç ¹®ÀÚµéÀÌ ÅëÇյǾúÀ¸´Ï ÁÁÀº ÀÏÀ̱ä ÇÏÁö¸¸ À̰͸¶Àú °¢ ³ª¶óº°·Î ÀÎÄÚµùÇÏ¿© »ç¿ëÇÏ´Ùº¸´Ï
ÇѱÛÀÌ ±úÁö°í ³­¸®Áö¿ä..¤Ð Áö±Ýµµ °è¼Ó ¹öÀüÀÌ ¾÷±×·¹ÀÌµå µÇ°í Àֳ׿ä. °¢ ³ª¶óº°·Î À¯´ÏÄÚµå ÀÎÄÚµùÀ» ¿Ö ÇÏ´À³Ä´Â ¾Æ¸¶µµ Â÷ÁöÇÏ´Â ¿ë·®À» ÁÙÀ̱â À§ÇÔ °°¾Æ¿ä. ISO-8859´Â ¼­À¯·´, EUC-KRÀº Çѱ¹ µî..)




UTF-8
À¯´ÏÄڵ带 À§ÇÑ °¡º¯ ±æÀÌ ¹®ÀÚ ÀÎÄÚµù ¹æ½Ä Áß Çϳª·Î, ÄË ÅèÇÁ½¼ °ú ·Ó ÆÄÀÌÅ©°¡ ¸¸µé¾ú½À´Ï´Ù.
ÀÌ ÀÎÄÚµùÀº À¯´ÏÄÚµå ÇÑ ¹®ÀÚ¸¦ ³ªÅ¸³»±â À§ÇØ 1Byte~4Byte±îÁö¸¦ »ç¿ë ÇÕ´Ï´Ù.
¾Æ½ºÅ°¿µ¿ªÀº 1Byte(¿µ¹®Æ÷ÇÔ), ÇѱÛÀÇ °æ¿ì´Â 3Byte¸¦ Â÷Áö ÇÕ´Ï´Ù.
±× ¿Ü UTF-16, UTF-32 µî ¸¹ÀÌ ÀÖÁö¸¸ »ý·«
(°³¹ß»ýÈ°Çϸ鼭 Á¦ÀÏ ¸¹ÀÌ Á¢ÇÏ´Â ¹®ÀÚ ÀÎÄÚµù ¹æ½Ä ÀÔ´Ï´Ù. °ÅÀÇ ´Ù ȣȯÀÌ µÇ´Ï±î¿ä.)


EUC-KR
EUC-KR ¿Ï¼ºÇü ÄÚµå·Î¼­ KSC5636 °ú KSC5601·Î ÇÕÃÄÁø ÀÎÄÚµù ¹æ½Ä ÀÔ´Ï´Ù.
KSC5636Àº ¿¾ À̸§ÀÌ°í, ÇöÀç´Â KS X 1003À¸·Î ºÒ¸³´Ï´Ù. Çѱ¹ »ê¾÷ ±Ô°ÝÀ¸·Î ÁöÁ¤µÈ ·Î¸¶ÀÚ ¹®ÀÚ ÁýÇÕ(¿µ¹® µî)À¸·Î,
1998³â¿¡ Á¦Á¤µÇ¾úÀ¸¸ç ÇöÀç´Â 2003³â¿¡ °³Á¤µÈ KS X 1003:2003 ÀÔ´Ï´Ù.
·Î¸¶ÀÚ ¹®ÀÚ ÁýÇÕÀÌ ÀüºÎ À̹ǷΠ¾Æ½ºÅ°¿Í °ÅÀÇ µ¿ÀÏÇÏ¸ç ¿ª½½·¡½Ã¿Í ¿øÈ­±âÈ£(\)°¡ µé¾î ÀÖ´Â °Í¸¸ ´Ù¸£´Ù.
KSC5601Àº ¿¾ À̸§ÀÌ°í, ÇöÀç´Â KS X 1001À¸·Î ºÒ¸³´Ï´Ù. Çѱ¹ »ê¾÷ ±Ô°ÝÀ¸·Î ÁöÁ¤µÈ Çѱ¹¾î ¹®ÀÚÁýÇÕÀ¸·Î,
1974³â¿¡ óÀ½À¸·Î Á¦Á¤µÇ¾ú°í, 2004³â¿¡ °³Á¤µÈ KS X 1001:2004 ÀÔ´Ï´Ù.
(¿ª»ç °øºÎµµ ¾Æ´Ï°í.. EUC-KR ÀÚÁÖ º¸À̳׿ä..)


CP949 (MS949)
¸¶ÀÌÅ©·Î¼ÒÇÁÆ®»ç°¡ µµÀÔÇÑ ÄÚµåÆäÀÌÁö·Î, º»·¡´Â KSC 5601ÀÇ ¿Ï¼ºÇü ÇѱÛÀ» Ç¥ÇöÇÑ ÄÚµå ÆäÀÌÁö ¿´À¸³ª, À©µµ¿ì95ºÎÅÍ
È®Àå ¿Ï¼ºÇüÀ̶ó´Â ¸íĪÀ¸·Î È®ÀåµÇ¾î Çö´ëÀÇ ¸ðµç ÇѱÛÀ» ¼ö¿ëÇÏ°Ô µÇ¾ú½À´Ï´Ù. CP949 ÀÎÄÚµùÀº EUC-KRÀÇ È®Àå.
(Áï EUC-KR º¸´Ù ÇÑ±Û ±ÛÀÚ¸¦ ´õ ¸¹ÀÌ Ç¥ÇöÇÒ ¼ö ÀÖ´Ù´Â À̾߱â À̳׿ä)


ISO/IEC 8859 (ISO-8859-1)
ISO¿Í IECÀÇ °øµ¿ Ç¥ÁØÀ¸·Î ISO/IEC 8859-1, -2, -3..n µîÀÇ ¼¼ºÎ Ç¥ÁØÀÌ Á¦¾È µÇ¾î ÀÖ½À´Ï´Ù.
ÁÖ·Î ISO-8859-1À» »ç¿ëÇÏ°í ÀÖÀ¸¸ç, ´ëºÎºÐÀÇ ¼­À¯·´ ¾ð¾î¸¦ Áö¿ø ÇÕ´Ï´Ù. (³×´ú¶õµå, ³ë¸£¿þÀÌ. µ§¸¶Å©, ¿µ¾î, ÇÁ¶û½º, ÀÌÅ»¸®¾Æ, ¸î°³ÀÇ ¾ÆÇÁ¸®Ä«¾î) ¶Ç ISO-8859-1Àº Latin-1 À̱⵵ ÇÕ´Ï´Ù.
Áß¿äÇÑ °Ç HTML ¹®¼­ÀÇ ±âº» ÀÎÄÚµùÀ̶ó´Â »ç½Ç ÀÔ´Ï´Ù.




Àâ´ã
HTML ¹®¼­ÀÇ ±âº» ij¸¯ÅͼÂÀº ISO-8859-1 (´ëºÎºÐÀÇ ¼­À¯·´±¹°¡ ij¸¯ÅͼÂ)  ÀÌ´Ù.
¿Ö UTF-8 ÀÌ ¾Æ´Ï¶ó ISOÀΰ¡? ³ª¸¸ÀÇ »ý°¢À¸·Î´Â HTML ¹®¼­¸¦ óÀ½¸¸µç »ç¶÷ÀÌ 1980³â À¯·´ ºÐÀÚ ¹°¸®ÇÐ ¿¬±¸¼ÒÀÎ
CERNÀÇ ¿¬±¸¿øÀ̾ú´ø ÆÀ ¹ö³Ê½º¶ó´Â »ç¶÷ÀÌ SGMLÀ̶ó´Â ¾ð¾î¸¦ º¸¿ÏÇÏ¿© ¸¸µé¾ú´Ù°í ÇÑ´Ù.
ÀÌ »ç¶÷ÀÌ À¯·´»ç¶÷Àΰ¡º¸´Ù. ¤¾
ÀÌ ÄÄÇ»Å͸¸ ¾Ë¾Æµè´Â 0 1 0 1 À» ÀÌ·¸°Ô ÀÎÄÚµùÀ» ÇÏ¿© ¼ö ¸¹Àº ÀÎÄÚµù ¹æ½ÄÀÌ »ý±â°Ô ÇÑ ÀÌÀ¯´Â
Á¤º¸ÀÇ Çüųª Çü½ÄÀ» Ç¥ÁØÈ­, º¸¾È, 󸮼ӵµÇâ»ó, ÀúÀå°ø°£ Àý¾à µîÀ» À§Çؼ­ ÀÌ´Ù.