2010.12.23 / 14:37
¾Æ½ºÅ°ÄÚµå(ASCII), À¯´ÏÄÚµå(UNICODE), À¯´ÏÄÚµåÀÇ ÀÎÄÚµù(UTF-8, EUC-KR, MS949, ISO-8859..)
Ȳº¸°ß¼ö
Ãßõ ¼ö 266
¾Æ½ºÅ°(ASCII,
American Standard Code for Information Interchange, ¹Ì±¹ Á¤º¸ ±³È¯ Ç¥ÁØ ºÎÈ£)
¿µ¹® ¾ËÆĺªÀ» »ç¿ëÇÏ´Â ´ëÇ¥ÀûÀÎ ¹®ÀÚ ÀÎÄÚµù, ÄÄÇ»ÅÍ¿Í Åë½ÅÀåºñ¸¦ ºñ·ÔÇÑ ¹®ÀÚ¸¦ »ç¿ëÇÏ´Â ¸¹Àº ÀåÄ¡¿¡¼ »ç¿ë
1967³â¿¡ Ç¥ÁØÀ¸·Î Á¦Á¤µÇ¾î 1986³â¿¡ ¸¶Áö¸· °³Á¤ÀÌ µÇ¾úÀ½.
1Byte·Î Ç¥ÇöµÇ°í, ºñÆ®·Î´Â 10Áø¼ö 0~255 ·Î Ç¥½ÃÇÒ ¼ö ÀÖ´Ù.
(ÄÄÇ»ÅͶó´Â °Ô ±º»ç¿ëÀ¸·Î¼ ¸ÕÀú »ç¿ëµÇ¾úÀ¸´Ï ÀÌ ¶ÇÇÑ ±× ¿ëµµ °ÚÁö¿ä? ¹Ì±¹»ç¶÷µé ÀÔ¸À¿¡ ¸Â°Ô Ç¥ÁØÀ» Á¤Çß´Ù°í º¼ ¼ö Àִµ¥ ÀÌ·± °Í º¸¸é °´ë±¹ÀÌ ±¦È÷ °´ë±¹ÀÌ ¾Æ´Ï¶õ »ý°¢ÀÌ µå³×¿ä.)
À¯´ÏÄÚµå (UNICODE)¿µ¹® ¾ËÆĺªÀ» »ç¿ëÇÏ´Â ´ëÇ¥ÀûÀÎ ¹®ÀÚ ÀÎÄÚµù, ÄÄÇ»ÅÍ¿Í Åë½ÅÀåºñ¸¦ ºñ·ÔÇÑ ¹®ÀÚ¸¦ »ç¿ëÇÏ´Â ¸¹Àº ÀåÄ¡¿¡¼ »ç¿ë
1967³â¿¡ Ç¥ÁØÀ¸·Î Á¦Á¤µÇ¾î 1986³â¿¡ ¸¶Áö¸· °³Á¤ÀÌ µÇ¾úÀ½.
1Byte·Î Ç¥ÇöµÇ°í, ºñÆ®·Î´Â 10Áø¼ö 0~255 ·Î Ç¥½ÃÇÒ ¼ö ÀÖ´Ù.
(ÄÄÇ»ÅͶó´Â °Ô ±º»ç¿ëÀ¸·Î¼ ¸ÕÀú »ç¿ëµÇ¾úÀ¸´Ï ÀÌ ¶ÇÇÑ ±× ¿ëµµ °ÚÁö¿ä? ¹Ì±¹»ç¶÷µé ÀÔ¸À¿¡ ¸Â°Ô Ç¥ÁØÀ» Á¤Çß´Ù°í º¼ ¼ö Àִµ¥ ÀÌ·± °Í º¸¸é °´ë±¹ÀÌ ±¦È÷ °´ë±¹ÀÌ ¾Æ´Ï¶õ »ý°¢ÀÌ µå³×¿ä.)
Àü ¼¼°èÀÇ ¸ðµç ¹®ÀÚ¸¦ ÄÄÇ»ÅÍ¿¡ ÀÏ°üµÇ°Ô Ç¥ÇöÇÏ°í ´Ù·ê ¼ö ÀÖµµ·Ï ¼³°èµÈ »ê¾÷
Ç¥ÁØ
À¯´ÏÄÚµå Çùȸ°¡ Á¦Á¤Çϸç, ÃÖ½ÅÆÇÀº 2009³â 10¿ù¿¡ °ø°³µÈ À¯´ÏÄÚµå 5.2 ÀÌ´Ù.
À¯´ÏÄÚµåÀÇ ¸ñÀûÀº ÇöÁ¸ÇÏ´Â ¹®ÀÚ ÀÎÄÚµù ¹æ¹ýµéÀ» ¸ðµÎ À¯´ÏÄÚµå·Î ±³Ã¼ÇÏ·Á´Â °ÍÀÌ´Ù.
±âÁ¸ÀÇ ÀÎÄÚµùµéÀº ±Ô¸ð³ª ¹üÀ§¸é¿¡ ÇÑÁ¤µÇ¾î ÀÖ°í, ´Ù±¹¾î ȯ°æ¿¡¼´Â ¼·Î ȣȯµÇÁö ¾Ê´Â ¹®Á¦Á¡ÀÌ ÀÖ¾ú´Ù.
À¯´ÏÄڵ尡 ´Ù¾çÇÑ ¹®ÀÚ ÁýÇÕµéÀ» ÅëÇÕÇÏ´Â µ¥ ¼º°øÇÏ¸é¼ ³Î¸® »ç¿ëµÇ°Ô µÇ¾ú´Ù.
ÀÌÇØÇϱâ ÆíÇÏ°Ô ¸»Çؼ ¼¼°è ¸ðµç ¹®ÀÚ¸¦ 0¹ø ºÎÅÍ ÂÞ¿í ~ ¹øÈ£¸¦ Á¤Çؼ ¸¸µç ÁýÇÕü ¶ó°í º¸½Ã¸é µË´Ï´Ù.
0000~ ºÎÅÍ ½ÃÀÛ Basic Latin, ÇѱÛÀº AC00 ºÎÅÍ ½ÃÀÛ ÇÕ´Ï´Ù. Âü°í (http://rudhar.com/lingtics/uniclnkl.htm)
pdfÆÄÀÏ·Î ´Ù¿î ¹ÞÀ¸½Ç ¼ö ÀÖ½À´Ï´Ù.
(À¯´ÏÄÚµå·Î¼ ¼¼°èÀÇ ¸ðµç ¹®ÀÚµéÀÌ ÅëÇյǾúÀ¸´Ï ÁÁÀº ÀÏÀ̱ä ÇÏÁö¸¸ À̰͸¶Àú °¢ ³ª¶óº°·Î ÀÎÄÚµùÇÏ¿© »ç¿ëÇÏ´Ùº¸´Ï
ÇѱÛÀÌ ±úÁö°í ³¸®Áö¿ä..¤Ð Áö±Ýµµ °è¼Ó ¹öÀüÀÌ ¾÷±×·¹ÀÌµå µÇ°í Àֳ׿ä. °¢ ³ª¶óº°·Î À¯´ÏÄÚµå ÀÎÄÚµùÀ» ¿Ö ÇÏ´À³Ä´Â ¾Æ¸¶µµ Â÷ÁöÇÏ´Â ¿ë·®À» ÁÙÀ̱â À§ÇÔ °°¾Æ¿ä. ISO-8859´Â ¼À¯·´, EUC-KRÀº Çѱ¹ µî..)
UTF-8À¯´ÏÄÚµå Çùȸ°¡ Á¦Á¤Çϸç, ÃÖ½ÅÆÇÀº 2009³â 10¿ù¿¡ °ø°³µÈ À¯´ÏÄÚµå 5.2 ÀÌ´Ù.
À¯´ÏÄÚµåÀÇ ¸ñÀûÀº ÇöÁ¸ÇÏ´Â ¹®ÀÚ ÀÎÄÚµù ¹æ¹ýµéÀ» ¸ðµÎ À¯´ÏÄÚµå·Î ±³Ã¼ÇÏ·Á´Â °ÍÀÌ´Ù.
±âÁ¸ÀÇ ÀÎÄÚµùµéÀº ±Ô¸ð³ª ¹üÀ§¸é¿¡ ÇÑÁ¤µÇ¾î ÀÖ°í, ´Ù±¹¾î ȯ°æ¿¡¼´Â ¼·Î ȣȯµÇÁö ¾Ê´Â ¹®Á¦Á¡ÀÌ ÀÖ¾ú´Ù.
À¯´ÏÄڵ尡 ´Ù¾çÇÑ ¹®ÀÚ ÁýÇÕµéÀ» ÅëÇÕÇÏ´Â µ¥ ¼º°øÇÏ¸é¼ ³Î¸® »ç¿ëµÇ°Ô µÇ¾ú´Ù.
ÀÌÇØÇϱâ ÆíÇÏ°Ô ¸»Çؼ ¼¼°è ¸ðµç ¹®ÀÚ¸¦ 0¹ø ºÎÅÍ ÂÞ¿í ~ ¹øÈ£¸¦ Á¤Çؼ ¸¸µç ÁýÇÕü ¶ó°í º¸½Ã¸é µË´Ï´Ù.
0000~ ºÎÅÍ ½ÃÀÛ Basic Latin, ÇѱÛÀº AC00 ºÎÅÍ ½ÃÀÛ ÇÕ´Ï´Ù. Âü°í (http://rudhar.com/lingtics/uniclnkl.htm)
pdfÆÄÀÏ·Î ´Ù¿î ¹ÞÀ¸½Ç ¼ö ÀÖ½À´Ï´Ù.
(À¯´ÏÄÚµå·Î¼ ¼¼°èÀÇ ¸ðµç ¹®ÀÚµéÀÌ ÅëÇյǾúÀ¸´Ï ÁÁÀº ÀÏÀ̱ä ÇÏÁö¸¸ À̰͸¶Àú °¢ ³ª¶óº°·Î ÀÎÄÚµùÇÏ¿© »ç¿ëÇÏ´Ùº¸´Ï
ÇѱÛÀÌ ±úÁö°í ³¸®Áö¿ä..¤Ð Áö±Ýµµ °è¼Ó ¹öÀüÀÌ ¾÷±×·¹ÀÌµå µÇ°í Àֳ׿ä. °¢ ³ª¶óº°·Î À¯´ÏÄÚµå ÀÎÄÚµùÀ» ¿Ö ÇÏ´À³Ä´Â ¾Æ¸¶µµ Â÷ÁöÇÏ´Â ¿ë·®À» ÁÙÀ̱â À§ÇÔ °°¾Æ¿ä. ISO-8859´Â ¼À¯·´, EUC-KRÀº Çѱ¹ µî..)
À¯´ÏÄڵ带 À§ÇÑ °¡º¯ ±æÀÌ ¹®ÀÚ ÀÎÄÚµù ¹æ½Ä Áß Çϳª·Î, ÄË ÅèÇÁ½¼ °ú ·Ó ÆÄÀÌÅ©°¡
¸¸µé¾ú½À´Ï´Ù.
ÀÌ ÀÎÄÚµùÀº À¯´ÏÄÚµå ÇÑ ¹®ÀÚ¸¦ ³ªÅ¸³»±â À§ÇØ 1Byte~4Byte±îÁö¸¦ »ç¿ë ÇÕ´Ï´Ù.
¾Æ½ºÅ°¿µ¿ªÀº 1Byte(¿µ¹®Æ÷ÇÔ), ÇѱÛÀÇ °æ¿ì´Â 3Byte¸¦ Â÷Áö ÇÕ´Ï´Ù.
±× ¿Ü UTF-16, UTF-32 µî ¸¹ÀÌ ÀÖÁö¸¸ »ý·«
(°³¹ß»ýÈ°ÇÏ¸é¼ Á¦ÀÏ ¸¹ÀÌ Á¢ÇÏ´Â ¹®ÀÚ ÀÎÄÚµù ¹æ½Ä ÀÔ´Ï´Ù. °ÅÀÇ ´Ù ȣȯÀÌ µÇ´Ï±î¿ä.)
EUC-KRÀÌ ÀÎÄÚµùÀº À¯´ÏÄÚµå ÇÑ ¹®ÀÚ¸¦ ³ªÅ¸³»±â À§ÇØ 1Byte~4Byte±îÁö¸¦ »ç¿ë ÇÕ´Ï´Ù.
¾Æ½ºÅ°¿µ¿ªÀº 1Byte(¿µ¹®Æ÷ÇÔ), ÇѱÛÀÇ °æ¿ì´Â 3Byte¸¦ Â÷Áö ÇÕ´Ï´Ù.
±× ¿Ü UTF-16, UTF-32 µî ¸¹ÀÌ ÀÖÁö¸¸ »ý·«
(°³¹ß»ýÈ°ÇÏ¸é¼ Á¦ÀÏ ¸¹ÀÌ Á¢ÇÏ´Â ¹®ÀÚ ÀÎÄÚµù ¹æ½Ä ÀÔ´Ï´Ù. °ÅÀÇ ´Ù ȣȯÀÌ µÇ´Ï±î¿ä.)
EUC-KR ¿Ï¼ºÇü ÄÚµå·Î¼ KSC5636 °ú KSC5601·Î ÇÕÃÄÁø ÀÎÄÚµù ¹æ½Ä
ÀÔ´Ï´Ù.
KSC5636Àº ¿¾ À̸§ÀÌ°í, ÇöÀç´Â KS X 1003À¸·Î ºÒ¸³´Ï´Ù. Çѱ¹ »ê¾÷ ±Ô°ÝÀ¸·Î ÁöÁ¤µÈ ·Î¸¶ÀÚ ¹®ÀÚ ÁýÇÕ(¿µ¹® µî)À¸·Î,
1998³â¿¡ Á¦Á¤µÇ¾úÀ¸¸ç ÇöÀç´Â 2003³â¿¡ °³Á¤µÈ KS X 1003:2003 ÀÔ´Ï´Ù.
·Î¸¶ÀÚ ¹®ÀÚ ÁýÇÕÀÌ ÀüºÎ À̹ǷΠ¾Æ½ºÅ°¿Í °ÅÀÇ µ¿ÀÏÇÏ¸ç ¿ª½½·¡½Ã¿Í ¿øȱâÈ£(\)°¡ µé¾î ÀÖ´Â °Í¸¸ ´Ù¸£´Ù.
KSC5601Àº ¿¾ À̸§ÀÌ°í, ÇöÀç´Â KS X 1001À¸·Î ºÒ¸³´Ï´Ù. Çѱ¹ »ê¾÷ ±Ô°ÝÀ¸·Î ÁöÁ¤µÈ Çѱ¹¾î ¹®ÀÚÁýÇÕÀ¸·Î,
1974³â¿¡ óÀ½À¸·Î Á¦Á¤µÇ¾ú°í, 2004³â¿¡ °³Á¤µÈ KS X 1001:2004 ÀÔ´Ï´Ù.
(¿ª»ç °øºÎµµ ¾Æ´Ï°í.. EUC-KR ÀÚÁÖ º¸À̳׿ä..)
KSC5636Àº ¿¾ À̸§ÀÌ°í, ÇöÀç´Â KS X 1003À¸·Î ºÒ¸³´Ï´Ù. Çѱ¹ »ê¾÷ ±Ô°ÝÀ¸·Î ÁöÁ¤µÈ ·Î¸¶ÀÚ ¹®ÀÚ ÁýÇÕ(¿µ¹® µî)À¸·Î,
1998³â¿¡ Á¦Á¤µÇ¾úÀ¸¸ç ÇöÀç´Â 2003³â¿¡ °³Á¤µÈ KS X 1003:2003 ÀÔ´Ï´Ù.
·Î¸¶ÀÚ ¹®ÀÚ ÁýÇÕÀÌ ÀüºÎ À̹ǷΠ¾Æ½ºÅ°¿Í °ÅÀÇ µ¿ÀÏÇÏ¸ç ¿ª½½·¡½Ã¿Í ¿øȱâÈ£(\)°¡ µé¾î ÀÖ´Â °Í¸¸ ´Ù¸£´Ù.
KSC5601Àº ¿¾ À̸§ÀÌ°í, ÇöÀç´Â KS X 1001À¸·Î ºÒ¸³´Ï´Ù. Çѱ¹ »ê¾÷ ±Ô°ÝÀ¸·Î ÁöÁ¤µÈ Çѱ¹¾î ¹®ÀÚÁýÇÕÀ¸·Î,
1974³â¿¡ óÀ½À¸·Î Á¦Á¤µÇ¾ú°í, 2004³â¿¡ °³Á¤µÈ KS X 1001:2004 ÀÔ´Ï´Ù.
(¿ª»ç °øºÎµµ ¾Æ´Ï°í.. EUC-KR ÀÚÁÖ º¸À̳׿ä..)
¸¶ÀÌÅ©·Î¼ÒÇÁÆ®»ç°¡ µµÀÔÇÑ ÄÚµåÆäÀÌÁö·Î, º»·¡´Â KSC 5601ÀÇ ¿Ï¼ºÇü ÇѱÛÀ» Ç¥ÇöÇÑ
ÄÚµå ÆäÀÌÁö ¿´À¸³ª, À©µµ¿ì95ºÎÅÍ
È®Àå ¿Ï¼ºÇüÀ̶ó´Â ¸íĪÀ¸·Î È®ÀåµÇ¾î Çö´ëÀÇ ¸ðµç ÇѱÛÀ» ¼ö¿ëÇÏ°Ô µÇ¾ú½À´Ï´Ù. CP949 ÀÎÄÚµùÀº EUC-KRÀÇ È®Àå.
(Áï EUC-KR º¸´Ù ÇÑ±Û ±ÛÀÚ¸¦ ´õ ¸¹ÀÌ Ç¥ÇöÇÒ ¼ö ÀÖ´Ù´Â À̾߱â À̳׿ä)
È®Àå ¿Ï¼ºÇüÀ̶ó´Â ¸íĪÀ¸·Î È®ÀåµÇ¾î Çö´ëÀÇ ¸ðµç ÇѱÛÀ» ¼ö¿ëÇÏ°Ô µÇ¾ú½À´Ï´Ù. CP949 ÀÎÄÚµùÀº EUC-KRÀÇ È®Àå.
(Áï EUC-KR º¸´Ù ÇÑ±Û ±ÛÀÚ¸¦ ´õ ¸¹ÀÌ Ç¥ÇöÇÒ ¼ö ÀÖ´Ù´Â À̾߱â À̳׿ä)
ISO¿Í IECÀÇ °øµ¿ Ç¥ÁØÀ¸·Î ISO/IEC 8859-1, -2, -3..n µîÀÇ ¼¼ºÎ
Ç¥ÁØÀÌ Á¦¾È µÇ¾î ÀÖ½À´Ï´Ù.
ÁÖ·Î ISO-8859-1À» »ç¿ëÇÏ°í ÀÖÀ¸¸ç, ´ëºÎºÐÀÇ ¼À¯·´ ¾ð¾î¸¦ Áö¿ø ÇÕ´Ï´Ù. (³×´ú¶õµå, ³ë¸£¿þÀÌ. µ§¸¶Å©, ¿µ¾î, ÇÁ¶û½º, ÀÌÅ»¸®¾Æ, ¸î°³ÀÇ ¾ÆÇÁ¸®Ä«¾î) ¶Ç ISO-8859-1Àº Latin-1 À̱⵵ ÇÕ´Ï´Ù.
Áß¿äÇÑ °Ç HTML ¹®¼ÀÇ ±âº» ÀÎÄÚµùÀ̶ó´Â »ç½Ç ÀÔ´Ï´Ù.
ÁÖ·Î ISO-8859-1À» »ç¿ëÇÏ°í ÀÖÀ¸¸ç, ´ëºÎºÐÀÇ ¼À¯·´ ¾ð¾î¸¦ Áö¿ø ÇÕ´Ï´Ù. (³×´ú¶õµå, ³ë¸£¿þÀÌ. µ§¸¶Å©, ¿µ¾î, ÇÁ¶û½º, ÀÌÅ»¸®¾Æ, ¸î°³ÀÇ ¾ÆÇÁ¸®Ä«¾î) ¶Ç ISO-8859-1Àº Latin-1 À̱⵵ ÇÕ´Ï´Ù.
Áß¿äÇÑ °Ç HTML ¹®¼ÀÇ ±âº» ÀÎÄÚµùÀ̶ó´Â »ç½Ç ÀÔ´Ï´Ù.
HTML ¹®¼ÀÇ ±âº» ij¸¯ÅͼÂÀº ISO-8859-1 (´ëºÎºÐÀÇ ¼À¯·´±¹°¡ ij¸¯ÅͼÂ)
ÀÌ´Ù.
¿Ö UTF-8 ÀÌ ¾Æ´Ï¶ó ISOÀΰ¡? ³ª¸¸ÀÇ »ý°¢À¸·Î´Â HTML ¹®¼¸¦ óÀ½¸¸µç »ç¶÷ÀÌ 1980³â À¯·´ ºÐÀÚ ¹°¸®ÇÐ ¿¬±¸¼ÒÀÎ
CERNÀÇ ¿¬±¸¿øÀ̾ú´ø ÆÀ ¹ö³Ê½º¶ó´Â »ç¶÷ÀÌ SGMLÀ̶ó´Â ¾ð¾î¸¦ º¸¿ÏÇÏ¿© ¸¸µé¾ú´Ù°í ÇÑ´Ù.
ÀÌ »ç¶÷ÀÌ À¯·´»ç¶÷Àΰ¡º¸´Ù. ¤¾
ÀÌ ÄÄÇ»Å͸¸ ¾Ë¾Æµè´Â 0 1 0 1 À» ÀÌ·¸°Ô ÀÎÄÚµùÀ» ÇÏ¿© ¼ö ¸¹Àº ÀÎÄÚµù ¹æ½ÄÀÌ »ý±â°Ô ÇÑ ÀÌÀ¯´Â
Á¤º¸ÀÇ Çüųª Çü½ÄÀ» Ç¥ÁØÈ, º¸¾È, 󸮼ӵµÇâ»ó, ÀúÀå°ø°£ Àý¾à µîÀ» À§Çؼ ÀÌ´Ù.
¿Ö UTF-8 ÀÌ ¾Æ´Ï¶ó ISOÀΰ¡? ³ª¸¸ÀÇ »ý°¢À¸·Î´Â HTML ¹®¼¸¦ óÀ½¸¸µç »ç¶÷ÀÌ 1980³â À¯·´ ºÐÀÚ ¹°¸®ÇÐ ¿¬±¸¼ÒÀÎ
CERNÀÇ ¿¬±¸¿øÀ̾ú´ø ÆÀ ¹ö³Ê½º¶ó´Â »ç¶÷ÀÌ SGMLÀ̶ó´Â ¾ð¾î¸¦ º¸¿ÏÇÏ¿© ¸¸µé¾ú´Ù°í ÇÑ´Ù.
ÀÌ »ç¶÷ÀÌ À¯·´»ç¶÷Àΰ¡º¸´Ù. ¤¾
ÀÌ ÄÄÇ»Å͸¸ ¾Ë¾Æµè´Â 0 1 0 1 À» ÀÌ·¸°Ô ÀÎÄÚµùÀ» ÇÏ¿© ¼ö ¸¹Àº ÀÎÄÚµù ¹æ½ÄÀÌ »ý±â°Ô ÇÑ ÀÌÀ¯´Â
Á¤º¸ÀÇ Çüųª Çü½ÄÀ» Ç¥ÁØÈ, º¸¾È, 󸮼ӵµÇâ»ó, ÀúÀå°ø°£ Àý¾à µîÀ» À§Çؼ ÀÌ´Ù.
[Ãâó] ¾Æ½ºÅ°ÄÚµå(ASCII), À¯´ÏÄÚµå(UNICODE), À¯´ÏÄÚµåÀÇ ÀÎÄÚµù(UTF-8, EUC-KR, MS949, ISO-8859..) (while (true) { System.out.println("µ·") }) |ÀÛ¼ºÀÚ µ¹