Hive 의 Serde
Serde 란 ?
직렬화와 역직렬화를 뜻하며, HDFS 와 HIVE 간의 데이터 교환을 뜻한다.
역직렬화(Deserializer)
HDFS files ▶ InputFileFormat ▶ <key, value> ▶ Deserializer ▶ Row object
HDFS 의 파일을 Hive 테이블에 저장
직렬화(Serializer)
Row object ▶ Serializer ▶ <key, value> ▶ OutputFileFormat ▶ HDFS files
Hive 테이블의 정보를 HDFS 의 파일로 저장
'IT > 빅데이터(bigData)' 카테고리의 다른 글
하이브(hive) udf (0) | 2014.11.25 |
---|---|
Hive 의 Serde 2 (0) | 2014.11.25 |
MapReduce 데이터 흐름 분석 (0) | 2014.11.25 |
Mapper 클래스 구성 및 사용 (0) | 2014.11.22 |
여러 기능의 맵리듀스를 하나의 jar 로 묶을때 (0) | 2014.11.22 |