Login

Home 태그 전체글 방명록 글쓰기 관리자

Lifelong Study

데이터베이스, NoSQL, 클라우드, 엑셀, MS Office 블로그

Lifelong Study
Lifelong Study
  • Home
  • Tags
  • Guestbook
  • Recents
Home

Lifelong Study

데이터베이스, NoSQL, 클라우드, 엑셀, MS Office 블로그

Tweet

Tweet: 1개의 글

[Spark] Json 포맷 처리하기 - Json Object List

들어가며 스파크에서는 CSV, Json, Protocol Buffer, Hadoop에서 지원하는 데이터 포맷 등 다양한 포맷을 지원을 한다. 이번에는 Json파일을 읽어서 스키마를 확인을 하고, 스키마에 있는 필요한 데이터를 추출하는 방법에 대해서 알아보려고 한다. 데이터는 공개되어 있는 tweet 데이터를 사용하였고, tweet데이터에서 내가 필요한 데이터를 추출하기 위한 과정을 소스코드로 작성해 보았습니다. 설명 소스 코드는 tweet의 데이터를 읽어들인 이후에 schema를 확인을 하여 데이터의 포맷이 어떻게 이루어져 있는지 확인을 합니다. (아래 스키마 그림 첨부 했습니다.) 스파크는 lazy execution을 하기 때문에 결과를 확인하기 위해 .take(N)을 사용했습니다. 처음에 tweets..

Big Data/Apache Spark | 2021. 5. 6. 01:56
«이전  1  다음»

Google Translator

Category

  • 전체보기 (525)
    • Database (227)
      • Oracle SQL (43)
      • Oracle SQL2 (16)
      • Oracle PLSQL (26)
      • Oracle Admin(9i) (13)
      • Oracle tuning (12)
      • Oracle 백업 복구 (0)
      • Oracle Tip (14)
      • mysql (50)
      • mysql tip (21)
      • mysql procedure, function (7)
      • MS Sql (4)
      • DB2 (0)
      • HANA (0)
      • Tibero (0)
      • Altibase (0)
      • Cubrid (0)
      • Informix (0)
      • PostgreSQL (0)
      • MariaDB (2)
      • sqlite (0)
      • HSQL(HyperSQL) (0)
      • ANSI SQL (9)
      • Sybase (0)
      • 대용량DB (8)
      • Apache Derby (0)
      • Vertica (1)
      • 기타 (1)
    • DB GUI Tool (12)
      • DataGrip (1)
      • Plsql developer (1)
      • Sql developer (0)
      • SQLYog (0)
      • Toad For Oracle (0)
      • Toad For Mysql (2)
      • Toad For Sql Sever (0)
      • Orange (1)
      • Erwin (0)
      • SQLGate (0)
      • Mysql Workbench (6)
      • Mysql-front (0)
      • phpMyadmin (0)
      • heidisql (0)
      • navicat (0)
      • SmartSQL (0)
      • DBA Master (0)
      • Golden (0)
      • OraSqler (0)
      • dbeaver (1)
    • DB Migration Tool (1)
      • Flyway (1)
    • NoSQL (33)
      • 개요 (4)
      • redis (14)
      • MongoDB (14)
      • Cassandra (1)
      • Couchbase (0)
    • NoSQL GUI Tool (2)
      • P3X for redis (0)
      • Redis Desktop Manager (0)
      • Medis for redis (1)
      • Studio 3T for MongoDB (1)
    • CDC (1)
      • Debezium (1)
    • AWS (20)
      • AWS - 일반 (0)
      • AWS - IAM (4)
      • AWS - EC2(Elastic Compute C.. (3)
      • AWS - RDS (1)
      • AWS - S3 (1)
      • AWS - CloudWatch (1)
      • AWS - Lambda (0)
      • AWS - CloudFront (1)
      • AWS - DynamoDB (0)
      • AWS - API Gateway (0)
      • AWS - CodeBase, CodeCommit,.. (1)
      • AWS - CLI (7)
      • AWS - Route 53 (0)
      • AWS - X-Ray (0)
      • AWS - KMS (0)
      • AWS - Elastic Beanstalk (0)
      • AWS - SQS & SNS & SES (1)
      • AWS - ECS & ECR (0)
      • AWS - CloudFormation (0)
      • AWS - ElastiCache (0)
      • AWS - EMR (0)
      • AWS - RedShift (0)
      • AWS - EKS(Elastic Kubernete.. (0)
      • AWS - EventBridge (0)
    • Elastic Stack (29)
      • ElasticSearch (27)
      • kibana (0)
      • logstash (2)
      • 로그수집 (0)
    • Big Data (78)
      • 빅데이터 (36)
      • 데이터 분석 (6)
      • Lucene (4)
      • Hadoop (7)
      • Apache Spark (17)
      • Apache Hive (5)
      • Greenplum (0)
      • Cloudera (3)
      • Trino (0)
      • Presto (0)
      • Apache Drill (0)
      • Apache Impala (0)
      • Apache Zeppelin (0)
    • BI 툴 (0)
      • superset (0)
      • Metabase (0)
      • Redash (0)
      • etc BI (0)
    • Infra (1)
      • domain, hosting (1)
    • 협업툴 (21)
      • jira (17)
      • confluence (3)
      • slack (0)
      • teams (1)
      • webex (0)
    • 엑셀 (91)
      • 엑셀 일반 (22)
      • 엑셀 함수 (36)
      • 엑셀 날짜,시간 (0)
      • 엑셀 필터,정렬 (0)
      • 엑셀 집계,피벗 (0)
      • 엑셀 차트 (5)
      • 엑셀 서식 (10)
      • 엑셀 VBA (5)
      • 엑셀 TIP (13)
    • Office Tool (4)
      • MS Word (0)
      • PowerPoint (0)
      • Outlook (4)
      • MS Access (0)
      • MS OneNote (0)
      • 아래아 한글 (0)
      • ohter (0)
    • Design (1)
      • Photoshop (1)
      • Flash (0)
      • Illustrator (0)
    • Media (1)
      • Vegas Pro (0)
      • Adobe premiere (0)
      • 3D MAX (1)
    • 유용한 프로그램 (2)
    • 기타 (1)

Adsense

Writings

Comments

Calendar

2025.7
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

Archive

Links

Counter

  • Today
    Yesterday
    Total

Donation

♥블로그 후원♥

RSS Feed

https://enterone.tistory.com/rss

Lifelong Study

Hosted by Daum · Powered by Tistory
Skin by Readiz · Based on Bootstrap
Blog Author: Lifelong Study

Skin Info

"FastBoot 1.6.2" Designed by Readiz
Inspired by yongzz, wincomi, Ungki. H
Further Information

Tistory links

홈 | 태그 | 미디어로그
지역로그 | 방명록
관리자 | 글쓰기


Copyright ⓒ 2013-2014 Lifelong Study All rights reserved. / Documentations under Creative Commons Attribution 3.0 / Open sources are copyright of their respective owners.

  • 전체보기 (525)
    • Database (227)
      • Oracle SQL (43)
      • Oracle SQL2 (16)
      • Oracle PLSQL (26)
      • Oracle Admin(9i) (13)
      • Oracle tuning (12)
      • Oracle 백업 복구 (0)
      • Oracle Tip (14)
      • mysql (50)
      • mysql tip (21)
      • mysql procedure, function (7)
      • MS Sql (4)
      • DB2 (0)
      • HANA (0)
      • Tibero (0)
      • Altibase (0)
      • Cubrid (0)
      • Informix (0)
      • PostgreSQL (0)
      • MariaDB (2)
      • sqlite (0)
      • HSQL(HyperSQL) (0)
      • ANSI SQL (9)
      • Sybase (0)
      • 대용량DB (8)
      • Apache Derby (0)
      • Vertica (1)
      • 기타 (1)
    • DB GUI Tool (12)
      • DataGrip (1)
      • Plsql developer (1)
      • Sql developer (0)
      • SQLYog (0)
      • Toad For Oracle (0)
      • Toad For Mysql (2)
      • Toad For Sql Sever (0)
      • Orange (1)
      • Erwin (0)
      • SQLGate (0)
      • Mysql Workbench (6)
      • Mysql-front (0)
      • phpMyadmin (0)
      • heidisql (0)
      • navicat (0)
      • SmartSQL (0)
      • DBA Master (0)
      • Golden (0)
      • OraSqler (0)
      • dbeaver (1)
    • DB Migration Tool (1)
      • Flyway (1)
    • NoSQL (33)
      • 개요 (4)
      • redis (14)
      • MongoDB (14)
      • Cassandra (1)
      • Couchbase (0)
    • NoSQL GUI Tool (2)
      • P3X for redis (0)
      • Redis Desktop Manager (0)
      • Medis for redis (1)
      • Studio 3T for MongoDB (1)
    • CDC (1)
      • Debezium (1)
    • AWS (20)
      • AWS - 일반 (0)
      • AWS - IAM (4)
      • AWS - EC2(Elastic Compute C.. (3)
      • AWS - RDS (1)
      • AWS - S3 (1)
      • AWS - CloudWatch (1)
      • AWS - Lambda (0)
      • AWS - CloudFront (1)
      • AWS - DynamoDB (0)
      • AWS - API Gateway (0)
      • AWS - CodeBase, CodeCommit,.. (1)
      • AWS - CLI (7)
      • AWS - Route 53 (0)
      • AWS - X-Ray (0)
      • AWS - KMS (0)
      • AWS - Elastic Beanstalk (0)
      • AWS - SQS & SNS & SES (1)
      • AWS - ECS & ECR (0)
      • AWS - CloudFormation (0)
      • AWS - ElastiCache (0)
      • AWS - EMR (0)
      • AWS - RedShift (0)
      • AWS - EKS(Elastic Kubernete.. (0)
      • AWS - EventBridge (0)
    • Elastic Stack (29)
      • ElasticSearch (27)
      • kibana (0)
      • logstash (2)
      • 로그수집 (0)
    • Big Data (78)
      • 빅데이터 (36)
      • 데이터 분석 (6)
      • Lucene (4)
      • Hadoop (7)
      • Apache Spark (17)
      • Apache Hive (5)
      • Greenplum (0)
      • Cloudera (3)
      • Trino (0)
      • Presto (0)
      • Apache Drill (0)
      • Apache Impala (0)
      • Apache Zeppelin (0)
    • BI 툴 (0)
      • superset (0)
      • Metabase (0)
      • Redash (0)
      • etc BI (0)
    • Infra (1)
      • domain, hosting (1)
    • 협업툴 (21)
      • jira (17)
      • confluence (3)
      • slack (0)
      • teams (1)
      • webex (0)
    • 엑셀 (91)
      • 엑셀 일반 (22)
      • 엑셀 함수 (36)
      • 엑셀 날짜,시간 (0)
      • 엑셀 필터,정렬 (0)
      • 엑셀 집계,피벗 (0)
      • 엑셀 차트 (5)
      • 엑셀 서식 (10)
      • 엑셀 VBA (5)
      • 엑셀 TIP (13)
    • Office Tool (4)
      • MS Word (0)
      • PowerPoint (0)
      • Outlook (4)
      • MS Access (0)
      • MS OneNote (0)
      • 아래아 한글 (0)
      • ohter (0)
    • Design (1)
      • Photoshop (1)
      • Flash (0)
      • Illustrator (0)
    • Media (1)
      • Vegas Pro (0)
      • Adobe premiere (0)
      • 3D MAX (1)
    • 유용한 프로그램 (2)
    • 기타 (1)

티스토리툴바