[KR] 하둡 맵리듀스에서 네트워크 패킷 분석을 위한 입력포맷 추출방법(Method for Extracting InputFormat for Handling Network Packet Data on Hadoop MapReduce)
- 국가/구분 KR/특허
- 해외특허 미국
- 출원번호/일자 10-2011-0006180 / 2011-01-21
- 등록번호/일자 10-1200773 / 2012-11-07
발명자
이영석 , 이연희
출원인
충남대학교산학협력단
본 발명은 하둡 맵리듀스에서 가변길이의 레코드를 갖는 바이너리 포맷의 패킷 데이터를 처리하기 위한 새로운 입력포맷에 관한 것으로, (A) 패킷의 캡쳐를 수행한 시작시간과 종료시간에 대한 정보를 configuration property로부터 획득하는 단계; (B) 하둡분산파일시스템(HDFS)에 저장된 데이터 블록 중 처리해야 될 데이터 블록에서 첫 패킷의 시작점을 검색하는 단계; (C) 상기 첫 패킷의 시작점을 InputSplit의 시작점으로 하여 이전 InputSplit과 자신의 InputSplit의 경계를 설정하는 것에 의해 InputSplit을 정의하는 단계; (D) 상기에서 정의된 자신의 InpuSplit 전체 영역에 대해 시작점으로부터 각 패킷의 캡쳐된 패킷헤더(pcap header)에 기록된 캡쳐된 패킷길이(capLen)만큼씩 읽는 일을 수행하는 RecordReader를 생성하고 이를 반환하는 단계; 및 (E) 상기 RecordReader를 통해 (Key, Value)를 (LongWritable, BytesWritable)의 형태로 레코드들을 추출하는 단계;를 포함하여 이루어지는 것을 특징으로 한다.