2008년 9월 29일 월요일

Derby 사용하기

가볍고 빠른 DB를 쓸 일이 있었는데 마침 딱 맞을 것 같아서 고른 Derby.

올해 초에 간단하게 써 보긴 했는데, 제대로 알고 쓰려고 하니 공부할 것이 꽤 많았다. 그래서, 열심히 삽질하면서 공부해서 필요한 걸 거의 3주만에 만들었는데, 그동안 공부한 것을 혹시 그냥 잊어 버리지 않을까 하는 마음에 정리도 할겸, 혹시 필요한 분들이 있으면 도움이 될까 해서 이렇게 글을 남겨 본다.

단, 여기서는 Embedded는 배제하고, Network Server를 중심으로 설명한다.


1. Derby

Derby는 관계형 데이터베이스의 하나로 맨 처음 IBMCloudscape라는 이름으로 WebSphere 등에서 사용하다가 Apache에 오픈소스로 공개되면서 Derby라는 이름을 갖게 되었다. 그후 Sun에서 JavaDB라는 이름을 붙여서 배포하게 되었고, JDK 6에 기본으로 포함되어 있다.

무료로 가볍고 간단하게 구성할 수 있으며 안정성이 높다. 다른 오픈소스 DB들에 비해 성능이 좀 떨어지지만 안정성이 우수하.


2. Derby의 연결방식

- Embedded 방식 : 하나의 JVM 내에 어플리케이션과 DB가 함께 존재하도록 구성하는 방식으로 다른 JVM이나 머신에서는 이 DB에 접근이 불가능하다.

- Network Server 방식 : 어플리케이션과 DB가 다른 JVM 또는 프로세스에 존재하도록 구성하는 방식으로 각 인스턴스가 하나의 JVM 내에서 동작하고, 일반적인 JDBC와 똑같은 방식으로 접근이 가능하다.

FISS의 경우, FISS_RULE을 비롯해 많은 커넥터들이 각기 다른 JVM으로 떠서 동작하고, 여기서 접근이 가능해야 하므로 Network Server 방식을 사용한다.

그러므로, 이하는 Network Server 방식을 기반으로 설명한다.

참고로, embedded 방식과 Network Server 방식은 JVM 외부에서의 접근가능여부와 Connection URL에서 IP가 들어가는 것 빼곤 사용방법이 동일하다.


3. Derby 인스턴스 기동

org.apache.derby.drda.NetworkServerControl 클래스를 실행시켜 기동(start), 정지(shutdown), (ping) 등의 작업을 수행할 수 있다.

java $JAVA_OPTION -classpath $CLASSPATH org.apache.derby.drda.NetworkServerControl start -p 54321 -h 192.168.1.123

-p 옵션은 인스턴스가 사용할 포트를 의미하며, 사용하지 않으면 Derbydefault 포트인 1527을 사용한다.

-h 옵션은 인스턴스가 요청을 받을 호스트를 나타내며, 호스트를 설정하면 그 외의 호스트명으로는 접근이 불가능하다. 제한을 두지 않으려면 이 옵션을 사용하지 않는다.


4. DB 연결 및 생성

사용자 계정을 이용한 연결기능도 지원하지만 여기서는 사용하지 않으므로 설명을 생략하고, 계정정보 없이 접속하면 defaultAPP라는 스키마를 사용한다. (계정정보를 이용해 접속하면 그 사용자 ID에 해당하는 스키마를 사용하게 된다.)

Derby는 특별히 DB를 생성하는 명령이 있지 않고, Connection URL의 끝에 “create=true”를 붙여 주었을 때 이 Connection URL에 해당하는 DB가 있으면 그냥 연결만 하고, 해당 DB가 존재하지 않으면 새롭게 생성한다. Connection URL에 “create=true”가 없을 때 해당 DB가 없으면 연결 오류가 발생한다.

DerbyJDBC 방식으로 연결하기 위한 Connection URL은 다음과 같다.


jdbc:derby://{IP}:{Port}/{DB생성디렉토리}/{DB};create=true

- IP : Derby Network Server가 떠 있는 머신의 IP를 나타내는데, 기동시 -h 옵션을 사용했다면 여기에 사용한 호스트명과 똑같이 입력해야 연결이 가능하다.

- Port : Derby Network Server기동할 때 -p 옵션을 사용했다면 여기서 사용한 포트번호를 입력한다. -p 옵션을 사용하지 않았다면 default 포트인 1527을 사용한다.

- DB생성디렉토리 : DB파일이 생성되는 디렉토리를 지정하고 싶으면 여기에 설정한다. , 디렉토리는 루트부터 시작하는 절대경로를 입력해야 하고, 그렇지 않으면 JVM을 실행하는 디렉토리의 하위디렉토리를 생성하고 거기에 DB파일을 생성한다. 루트부터 입력하므로 유닉스는 슬래쉬(/)2번 반복된다. 생략하면 JVM이 실행되는 디렉토리가 default이다.

- DB: DB명도 되고, DB데이터파일이 저장되는 디렉토리명도 된다. DB생성디렉토리를 설정했으면 그 하위에 디렉토리로 생기고, 그렇지 않으면 JVM이 실행된 디렉토리 아래에 생성된다.

- create=true : DB생성디렉토리에 해당 DB명이 있으면 상관없는데, 해당 DB명이 없으면 그 위치에 DB데이터 디렉토리를 자동으로 생성한다. 이 옵션을 사용하지 않으면 해당디렉토리에 해당 DB가 있으면 연결하고, 없으면 오류가 발생한다.


윈도우 예> jdbc:derby://localhost:1527/C:/derby/RULEDB1;create=true

UNIX > jdbc:derby://localhost:1527//usr/derby/RULEDB1;create=true


JDBC 방식의 연결은 DerbyJDBC Client 드라이버인 org.apache.derby.jdbc.ClientDriver를 로딩하고 위의 URL을 이용해서 DriverManager.getConnection을 호출하면 된다.


예제 코드>

Class.forName(org.apache.derby.jdbc.ClientDriver).newInstance();

DriverManager.getConnection(“jdbc:derby://localhost:1527/C:/derby/RULEDB1;create=true”);


그 밖에도 Derby에서 제공하는 DataSource도 이용 가능하다.


참고사항 : 하나의 인스턴스를 통해서 여러 DB에 접근할 수 있다. 하지만, 여러 인스턴스가 동시에 하나의 DB를 사용할 수는 없다. 그러므로, 어떤 DB를 어떤 인스턴스가 사용할지 명확하게 해 두어야 한다.

1527포트의 인스턴스를 통해 ruledb1ruledb2를 접근할 수는 있지만, 1527포트의 인스턴스와 1528포트의 인스턴스가 동시에 ruledb1이라는 DB를 접근할 수는 없다는 뜻이다.

※ Derby에 connection을 만들자 마자 autocommit을 false로 설정하는 것이 좋다. 그렇지 않으면, CUD 뿐만 아니라 R 처리에서도 부하가 가해지면 오류가 잔뜩 떨어지면서 문제가 발생한다. 하지만, autocommit을 false로 해 놓으면 꽤 많은 부하가 가해져도 오류없이 잘 처리해낸다. 단, 이렇게 되면 CUD는 무조건 commit, rollback을 해 줘야 한다.


5. 쿼리 수행

일반 JDBC동일하.


참고사항 : Derby에서 가장 빨리 수행될 수 있는 쿼리는 ‘SELECT 1 FROM SYSIBM.SYSDUMMY1’ 이다. SYSIBM.SYSDUMMY1 테이블은 오라클의 DUAL과 비슷한 기능이다.


- 오늘날짜 : SELECT CURRENT_DATE FROM SYSIBM.SYSDUMMY1 → 2008-09-29

- 현재시간 : SELECT CURRENT_TIME FROM SYSIBM.SYSDUMMY1 → 17:42:06

- 타임스탬프 : SELECT CURRENT_TIMESTAMP FROM SYSIBM.SYSDUMMY1 → 2008-09-29 17:42:13.328

시간이나 날짜를 문자열로 포맷팅하는 함수는 제공하지 않는 것 같다. 아마도 위에서 나오는 문자열을 substring으로 잘라서 쓰거나, 원래의 데이터타입을 이용해 setDategetDate를 이용해야 할 것 같다.


6. ij (Derby용 유틸리티 프로그램) 사용

DerbyNetwork Server로 기동시키면 EclipseData Source Explorer로 접속도 가능하고, Derby와 함께 제공되는 ij라는 유틸리티로도 접근이 가능하다.

- ij 실행

명령프롬프트에서 $DERBY_HOME/binij 를 실행한다.

C:\derby\bin> ij

- DB 연결

connect 명령과 connection URL을 이용해서 DB에 연결한다.

ij> connect 'jdbc:derby://localhost:1527/C:/derby/RULEDB1';

- ij 명령어 보기

ij> help;

- 스키마 목록 보기

ij> show schemas;

- 현재 연결된 DB들에 대한 연결정보 보기

ij> show connections;

- 테이블 리스트 보기

ij> show tables;

- 테이블 구조 보기

ij> describe {테이블명};

- ij 끝내기

ij> exit;

- 그 밖에 모든 DDL, DML 수행 가능하며, 끝은 반드시 세미콜론(;)으로 끝나고 엔터를 쳐야 실행된다.




Derby를 이용해서 프로그램을 다 만든 다음에 용도에 딱 맞는 프로그램을 하나 찾았다.

Memcached(멤캐쉬디)라고 아마도 Memory Cache Daemon의 줄임말이 아닐까 생각이 된다.

웹페이지 로딩을 빠르게 하기 위해 만들어졌다고 본 것 같은데,

키와 Object의 pair로 저장이 되고, 정해진 메모리양을 넘어가면 LRU 방식으로 비워 가면서 정보를 추가한다.

데몬을 띄울 때 메모리의 양을 할당하는 옵션이 있고,

2개 이상의 동일한 내용을 담을 데몬을 띄워 놓을 수 있는데

클라이언트 객체를 만들 때 이들 데몬의 호스트명과 포트명을 한꺼번에 주면

데몬 하나가 죽을 때 다른 살아있는 데몬에 읽고 쓸 수 있기 때문에 장애에 대한 대처도 가능하다.

단, 소스가 C로 작성되어 있어서 실행하려면 OS에 따라 컴파일해서 사용해야 한다.

유명한 OS(윈도우 포함)인 경우는 컴파일해서 올려 놓은 프로그램을 다운받아서 사용해도 된다.

클라이언트는 다양한 언어로 구현된 것이 올라와 있기 때문에 골라서 사용하면 된다.

나는 윈도우용으로 컴파일된 프로그램을 설치하고 띄운 후에,

자바 클라이언트로 접속해서 사용해 봤는데 잘 작동했고 성능도 괜찮았던 것 같았다.

(몇 달 만에 기억을 더듬으며 쓰려니 가물가물하넹.)

참, 이것도 오픈소스이다.

참고로 테스트용으로 사용한 자바 소스파일 첨부했으니 참고하시길...

여러 데몬에 한꺼번에 연결하려면 아래와 같이 고치면 됨.

MemcachedClient c = new MemcachedClient(AddrUtil.getAddresses("server1:11211 server2:11211"));



자세한 내용은 아래의 홈페이지 참조 요망~

www.danga.com/memcached/


자바 클라이언트 download 및 설명

http://code.google.com/p/spymemcached/




댓글 2개: