본문 바로가기
학소리

2023년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어, 맵리듀스 과정 등

by 멈춘그대 2023. 9. 4.
반응형

2023년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어, 맵리듀스 과정 등

 비정형데이터분석.zip
해당 자료는 해피레포트에서 유료결제 후 열람이 가능합니다.분량 : 14 페이지 /zip 파일설명 : 교재를 중심으로 다양한 문헌을 참고하여
과제물에 적합한 형식과 내용으로 정성을 다해 작성했습니다.
구매자분들이 바쁜 일상 속에서도 양질의 리포트를 작성하시는 데
시간과 노력을 최소화할 수 있는 과제물입니다.
리포트 작성에 참고하시어 좋은 성적 받으세요.^^

4번은 r코드를 실행한 결과를 html파일(4번문제.html)로 첨부했습니다.

문단 모양(왼쪽 여백 0, 오른쪽 여백 0, 줄간격 160%)
글자 모양(굴림체, 장평 100%, 크기 11 pt, 자간 0%)

행복하세요~목차

1. 개인정보, 가명정보, 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어 설명하시오. 또한 가명정보 활용이 개인에게 미치는 영향에 관해 개인정보 보호의 입장에서 논하시오. (9점)

1) 개인정보, 가명정보, 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어 설명하시오.
①개인정보 ②가명정보 ③익명정보 ④교재 외 사례
2) 가명정보 활용이 개인에게 미치는 영향에 관해 개인정보 보호의 입장에서 논하시오.

2. 빅데이터 시대에 접어들어 비정형데이터 분석의 중요성이 부각되는 이유는 무엇인지 기술하고 자신이 비정형데이터 분석자라고 가정할 때, 어떠한 어려움이 예상되며 어떤 해결책을 제시할 수 있을지 (독창적으로) 논하시오. (9점)
1) 비정형데이터 분석의 중요성이 부각되는 이유
2) 비정형데이터 분석의 어려움과 해결책

3. 다음 <보기>와 같은 텍스트 데이터가 존재한다고 가정하자. 이 데이터가 맵리듀스 과정의 input 데이터라면 이후의 맵리듀스 과정은 어떻게 진행될 것인지 단계별로 도시하고 설명하시오. (단, Splitting 단계에서는 문장구조에 상관없이 첫 단어부터 시작하여 세 단어씩 나누어진다고 가정하고 대소문자는 구별하지 않음) (6점)

4. R의 ‘rvest’ 및 ‘dplyr’ 패키지를 이용하여 웹페이지(교재 사례 외)의 텍스트를 읽어오는 코드를 작성하고 실행결과를 제시하시오. 단, 과제 작성일을 명시하고 당일 최신 갱신된 웹페이지의 내용을 읽어와야 합니다. (6점)

5. 참고문헌


본문일부

1. 개인정보, 가명정보, 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어 설명하시오. 또한 가명정보 활용이 개인에게 미치는 영향에 관해 개인정보 보호의 입장에서 논하시오. (9점)

1) 개인정보, 가명정보, 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어 설명하시오.

개인정보, 가명정보, 익명정보의 차이를 설명하기에 앞서, 비식별화의 개념부터 정리할 필요가 있다. 비식별화란, 빅데이터 분석 결과물에서 개인 식별자 값이 제거 또는 알아볼 수 없도록 변환되거나 개인정보가 표본값, 평균값, 최대최소값 등으로 범주화되는 등으로 인해 개인에 대한 식별성이 제거되어도 빅데이터의 활용 목적이 상당부분 달성될 수 있다는 점에 착안하여, 이 경우 ‘개인정보’에 대해 부과되는 엄격한 규제의 적용을 전부 또는 일부 면해주는 접근방식이다.

이때 비식별화의 핵심은 어느 정도로 개인을 알아보기 어렵도록 조치해야 하느냐이다. 이에 대해 유럽의 일반 개인정보 보호법(GDPR, General Data Protection Regulation)은 가명화(pseudonymisation) 및 익명화(anonymisation)라는 개념을 제시했다. 여기서 전자(가명정보)는 개인정보 규제의 일부 면제 대상이고, 후자(익명정보)는 전부 면제 대상이 된다.

가명화란 추가 정보(additional information)의 이용 없이는 더 이상 특정 정보주체를 식별할 수 없는 방식으로 개인정보를 처리하는 것이다. 즉, 가명화된 정보는 개인정보에서 식별자를 가명(pseudonym)으로 대체함으로써 본래 식별자와 가명 사이의 대응 정보와 같은 ‘추가 정보’를 이용하지 않고는 특정 개인을 알아볼 수 없는 상태의 정보이다. 단,‘추가 정보’가 개인 식별에 이용될 수 없도록 분리 보관되는 등 기술적?관리적 조치가 요구된다. 가명화된 정보도 여전히 개인정보로 취급되지만, 공익을 위한 기록보존, 과학적?역사적 연구(사인의 영리목적 연구 포함) 또는 통계 목적의 활용이 허용된다.


참고문헌

장영재·손원·황희진, 비정형데이터분석, 한국방송통신대학교출판문화원, 2020.
R Documentation : https://www.r-project.org/other-docs.html
가명정보 처리 가이드라인, 개인정보보호위원회, 2022.4.
전승재·권헌영(2018), 『개인정보, 가명정보, 익명정보에 관한4개국 법제 비교분석』. 정보법학 제22권 제3호.
국가법령정보센터 https://www.law.go.kr/
개인정보보호포털 https://www.privacy.go.kr/nns/ntc/inf/personalInfo.do
개인정보보호위원회 https://www.pipc.go.kr/np/
개인정보보호위원회·보건복지부, 보건의료 데이터활용 가이드라인 2020.8.
금융위원회·금융감독원, 금융분야 가명·익명처리 20안내서(2022.01).
비정형 데이터로부터 새로운비즈니스 인사이트를 찾아내는 방법
https://www.ibm.com/downloads/cas/NDJYNLAV출처 : 해피레포트 자료실

https://youtu.be/TPKZNkVhBYg

 

반응형