Lifelong Study
close
프로필 배경
프로필 로고

Lifelong Study

  • 분류 전체보기 (525)
    • Database (227)
      • Oracle SQL (43)
      • Oracle SQL2 (16)
      • Oracle PLSQL (26)
      • Oracle Admin(9i) (13)
      • Oracle tuning (12)
      • Oracle 백업 복구 (0)
      • Oracle Tip (14)
      • mysql (50)
      • mysql tip (21)
      • mysql procedure, function (7)
      • MS Sql (4)
      • DB2 (0)
      • HANA (0)
      • Tibero (0)
      • Altibase (0)
      • Cubrid (0)
      • Informix (0)
      • PostgreSQL (0)
      • MariaDB (2)
      • sqlite (0)
      • HSQL(HyperSQL) (0)
      • ANSI SQL (9)
      • Sybase (0)
      • 대용량DB (8)
      • Apache Derby (0)
      • Vertica (1)
      • 기타 (1)
    • DB GUI Tool (12)
      • DataGrip (1)
      • Plsql developer (1)
      • Sql developer (0)
      • SQLYog (0)
      • Toad For Oracle (0)
      • Toad For Mysql (2)
      • Toad For Sql Sever (0)
      • Orange (1)
      • Erwin (0)
      • SQLGate (0)
      • Mysql Workbench (6)
      • Mysql-front (0)
      • phpMyadmin (0)
      • heidisql (0)
      • navicat (0)
      • SmartSQL (0)
      • DBA Master (0)
      • Golden (0)
      • OraSqler (0)
      • dbeaver (1)
    • DB Migration Tool (1)
      • Flyway (1)
    • NoSQL (33)
      • 개요 (4)
      • redis (14)
      • MongoDB (14)
      • Cassandra (1)
      • Couchbase (0)
    • NoSQL GUI Tool (2)
      • P3X for redis (0)
      • Redis Desktop Manager (0)
      • Medis for redis (1)
      • Studio 3T for MongoDB (1)
    • CDC (1)
      • Debezium (1)
    • AWS (20)
      • AWS - 일반 (0)
      • AWS - IAM (4)
      • AWS - EC2(Elastic Compute C.. (3)
      • AWS - RDS (1)
      • AWS - S3 (1)
      • AWS - CloudWatch (1)
      • AWS - Lambda (0)
      • AWS - CloudFront (1)
      • AWS - DynamoDB (0)
      • AWS - API Gateway (0)
      • AWS - CodeBase, CodeCommit,.. (1)
      • AWS - CLI (7)
      • AWS - Route 53 (0)
      • AWS - X-Ray (0)
      • AWS - KMS (0)
      • AWS - Elastic Beanstalk (0)
      • AWS - SQS & SNS & SES (1)
      • AWS - ECS & ECR (0)
      • AWS - CloudFormation (0)
      • AWS - ElastiCache (0)
      • AWS - EMR (0)
      • AWS - RedShift (0)
      • AWS - EKS(Elastic Kubernete.. (0)
      • AWS - EventBridge (0)
    • Elastic Stack (29)
      • ElasticSearch (27)
      • kibana (0)
      • logstash (2)
      • 로그수집 (0)
    • Big Data (78)
      • 빅데이터 (36)
      • 데이터 분석 (6)
      • Lucene (4)
      • Hadoop (7)
      • Apache Spark (17)
      • Apache Hive (5)
      • Greenplum (0)
      • Cloudera (3)
      • Trino (0)
      • Presto (0)
      • Apache Drill (0)
      • Apache Impala (0)
      • Apache Zeppelin (0)
    • BI 툴 (0)
      • superset (0)
      • Metabase (0)
      • Redash (0)
      • etc BI (0)
    • Infra (1)
      • domain, hosting (1)
    • 협업툴 (21)
      • jira (17)
      • confluence (3)
      • slack (0)
      • teams (1)
      • webex (0)
    • 엑셀 (91)
      • 엑셀 일반 (22)
      • 엑셀 함수 (36)
      • 엑셀 날짜,시간 (0)
      • 엑셀 필터,정렬 (0)
      • 엑셀 집계,피벗 (0)
      • 엑셀 차트 (5)
      • 엑셀 서식 (10)
      • 엑셀 VBA (5)
      • 엑셀 TIP (13)
    • Office Tool (4)
      • MS Word (0)
      • PowerPoint (0)
      • Outlook (4)
      • MS Access (0)
      • MS OneNote (0)
      • 아래아 한글 (0)
      • ohter (0)
    • Design (1)
      • Photoshop (1)
      • Flash (0)
      • Illustrator (0)
    • Media (1)
      • Vegas Pro (0)
      • Adobe premiere (0)
      • 3D MAX (1)
    • 유용한 프로그램 (2)
    • 기타 (1)
  • 홈
  • 태그
  • 미디어로그
  • 위치로그
  • 방명록
[Spark] Row의 Seq Collection으로 RDD, DataFrame 생성하기

[Spark] Row의 Seq Collection으로 RDD, DataFrame 생성하기

들어가며 스파크에서 구현을 하다 보면 각 객체간의 변환(?)이 자유로워야 하는것 같다. 예를 들면 RDD에서 추출한 데이터를 DataFrame으로 생성한다든지, DataFrame에서 여러개의 Row를 추출해서 새로운 RDD를 생성한다는 식의 경우를 말한다. 이번에 당면한 문제는 Json Object의 요소를 저장하고 있는 Seq의 Collection을 갖고 있었고, 이 Collection을 바탕으로 DataFrame의 생성이 필요했다. 이번에는 Seq[org.apache.spark.sql.Row]의 데이터를 RDD와 DataFrame으로 변환하는 방법에 대해서 정리를 해보려고 한다. 소스코드 logData는 org.apache.spark.sql.Row의 값을 갖고 있다. logData에서 field명이 ..

  • format_list_bulleted Big Data/Apache Spark
  • · 2021. 5. 6.
  • textsms
  • navigate_before
  • 1
  • navigate_next
글쓰기 관리자
전체 카테고리
  • 분류 전체보기 (525)
    • Database (227)
      • Oracle SQL (43)
      • Oracle SQL2 (16)
      • Oracle PLSQL (26)
      • Oracle Admin(9i) (13)
      • Oracle tuning (12)
      • Oracle 백업 복구 (0)
      • Oracle Tip (14)
      • mysql (50)
      • mysql tip (21)
      • mysql procedure, function (7)
      • MS Sql (4)
      • DB2 (0)
      • HANA (0)
      • Tibero (0)
      • Altibase (0)
      • Cubrid (0)
      • Informix (0)
      • PostgreSQL (0)
      • MariaDB (2)
      • sqlite (0)
      • HSQL(HyperSQL) (0)
      • ANSI SQL (9)
      • Sybase (0)
      • 대용량DB (8)
      • Apache Derby (0)
      • Vertica (1)
      • 기타 (1)
    • DB GUI Tool (12)
      • DataGrip (1)
      • Plsql developer (1)
      • Sql developer (0)
      • SQLYog (0)
      • Toad For Oracle (0)
      • Toad For Mysql (2)
      • Toad For Sql Sever (0)
      • Orange (1)
      • Erwin (0)
      • SQLGate (0)
      • Mysql Workbench (6)
      • Mysql-front (0)
      • phpMyadmin (0)
      • heidisql (0)
      • navicat (0)
      • SmartSQL (0)
      • DBA Master (0)
      • Golden (0)
      • OraSqler (0)
      • dbeaver (1)
    • DB Migration Tool (1)
      • Flyway (1)
    • NoSQL (33)
      • 개요 (4)
      • redis (14)
      • MongoDB (14)
      • Cassandra (1)
      • Couchbase (0)
    • NoSQL GUI Tool (2)
      • P3X for redis (0)
      • Redis Desktop Manager (0)
      • Medis for redis (1)
      • Studio 3T for MongoDB (1)
    • CDC (1)
      • Debezium (1)
    • AWS (20)
      • AWS - 일반 (0)
      • AWS - IAM (4)
      • AWS - EC2(Elastic Compute C.. (3)
      • AWS - RDS (1)
      • AWS - S3 (1)
      • AWS - CloudWatch (1)
      • AWS - Lambda (0)
      • AWS - CloudFront (1)
      • AWS - DynamoDB (0)
      • AWS - API Gateway (0)
      • AWS - CodeBase, CodeCommit,.. (1)
      • AWS - CLI (7)
      • AWS - Route 53 (0)
      • AWS - X-Ray (0)
      • AWS - KMS (0)
      • AWS - Elastic Beanstalk (0)
      • AWS - SQS & SNS & SES (1)
      • AWS - ECS & ECR (0)
      • AWS - CloudFormation (0)
      • AWS - ElastiCache (0)
      • AWS - EMR (0)
      • AWS - RedShift (0)
      • AWS - EKS(Elastic Kubernete.. (0)
      • AWS - EventBridge (0)
    • Elastic Stack (29)
      • ElasticSearch (27)
      • kibana (0)
      • logstash (2)
      • 로그수집 (0)
    • Big Data (78)
      • 빅데이터 (36)
      • 데이터 분석 (6)
      • Lucene (4)
      • Hadoop (7)
      • Apache Spark (17)
      • Apache Hive (5)
      • Greenplum (0)
      • Cloudera (3)
      • Trino (0)
      • Presto (0)
      • Apache Drill (0)
      • Apache Impala (0)
      • Apache Zeppelin (0)
    • BI 툴 (0)
      • superset (0)
      • Metabase (0)
      • Redash (0)
      • etc BI (0)
    • Infra (1)
      • domain, hosting (1)
    • 협업툴 (21)
      • jira (17)
      • confluence (3)
      • slack (0)
      • teams (1)
      • webex (0)
    • 엑셀 (91)
      • 엑셀 일반 (22)
      • 엑셀 함수 (36)
      • 엑셀 날짜,시간 (0)
      • 엑셀 필터,정렬 (0)
      • 엑셀 집계,피벗 (0)
      • 엑셀 차트 (5)
      • 엑셀 서식 (10)
      • 엑셀 VBA (5)
      • 엑셀 TIP (13)
    • Office Tool (4)
      • MS Word (0)
      • PowerPoint (0)
      • Outlook (4)
      • MS Access (0)
      • MS OneNote (0)
      • 아래아 한글 (0)
      • ohter (0)
    • Design (1)
      • Photoshop (1)
      • Flash (0)
      • Illustrator (0)
    • Media (1)
      • Vegas Pro (0)
      • Adobe premiere (0)
      • 3D MAX (1)
    • 유용한 프로그램 (2)
    • 기타 (1)
최근 글
인기 글
최근 댓글
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바