그냥 사는 이야기

java String에서 character set 문제 및 변환 본문

Development/개발언어

java String에서 character set 문제 및 변환

없다캐라 2008. 8. 21. 16:40
반응형

eclipse의 character set

eclipse에서 OS language가 한글인지 영어인지 따라 target character set의 encoding이 달랐다. 유니코드면 다같은 건줄 알았는데 또 더 상세하게 알아야 할 것이 있었다.

한글 windows일 땐 MS949 를 사용하고 영어 windows일 땐 Cp1252 라는 encoding가 설정되어 있다.

물론 어떻게든 바꿔 줄 수는 있겠지만 소스 코드 차원에서 encoding을 바꿔 주기 위해서는

String convert = new String(message.getBytes("windows-1252"), "x-windows-949");

windows-1252 -> x-windows-949 CharacterSet 으로 인코딩 해서 String 객체를 만들어 준다.

참고

  • windows-1252: cp1252, cp5348
  • x-windows-949: windows-949, ms_949, windows949, ms949

US-ASCII나 EUC-KR은 별로 안쓰이나 보다.

Comments