⌜숫자둜 λ§ν•˜λŠ” 힘, 파이썬 데이터 뢄석 μž…λ¬ΈβŒŸ

Chapter 1. 코딩은 무엇이고, 데이터 뢄석은 μ™œ ν•„μš”ν•œκ°€

0️⃣ 2025. 12. 31. 20:35

μ½”λ”©κ³Ό 파이썬, 그리고 데이터 뢄석

1. 이 κ°•μ’ŒλŠ” μ–΄λ–€ μ‚¬λžŒμ„ μœ„ν•œκ°€

이 μ‹œλ¦¬μ¦ˆλŠ” λ‹€μŒκ³Ό 같은 ν•™μŠ΅μžλ₯Ό λŒ€μƒμœΌλ‘œ ν•©λ‹ˆλ‹€.

  • ν”„λ‘œκ·Έλž˜λ°μ„ ν•œ λ²ˆλ„ ν•΄λ³Έ 적 μ—†λŠ” μ‚¬λžŒ
  • μˆ«μžλ‚˜ μ½”λ“œλŠ” μ–΄λ ΅μ§€λ§Œ, μ΄ν•΄ν•˜κ³  싢은 μ‚¬λžŒ
  • “데이터 뢄석”μ΄λΌλŠ” 말을 λ“€μ–΄λ΄€μ§€λ§Œ μ •ν™•νžˆ 뭘 ν•˜λŠ”μ§€λŠ” λͺ¨λ₯΄λŠ” μ‚¬λžŒ
  • μ—‘μ…€ λ‹€μŒ λ‹¨κ³„λ‘œ νŒŒμ΄μ¬μ„ κ³ λ―Όν•˜λŠ” μ‚¬λžŒ

λ³Έ κ°•μ’ŒλŠ” Google Colab을 개발 ν™˜κ²½μœΌλ‘œ μ‚¬μš©ν•˜λ©°, μ„€μΉ˜ κ³Όμ • 없이 λΈŒλΌμš°μ €λ§ŒμœΌλ‘œ μ‹€μŠ΅ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

https://colab.google/

 

colab.google

Colab is a hosted Jupyter Notebook service that requires no setup to use and provides free access to computing resources, including GPUs and TPUs. Colab is especially well suited to machine learning, data science, and education.

colab.google

 

 

<Google Colab μ‹œμž‘ν•˜λŠ” 법>

012


2. ν”„λ‘œκ·Έλž˜λ°μ΄λž€ 무엇인가?

βœ” ν•œ λ¬Έμž₯ μ •μ˜

ν”„λ‘œκ·Έλž˜λ°μ΄λž€, μ»΄ν“¨ν„°μ—κ²Œ 일을 μ‹œν‚€λŠ” 방법을 κΈ€λ‘œ μ λŠ” 것이닀.

μ»΄ν“¨ν„°λŠ” 슀슀둜 νŒλ‹¨ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

μ‚¬λžŒμ΄ μ •ν•΄μ€€ κ·œμΉ™μ„ μ •ν™•ν•œ μˆœμ„œλŒ€λ‘œ μ‹€ν–‰ν•  λΏμž…λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄,

  • “숫자 두 개λ₯Ό 더해라”
  • “쑰건에 맞으면 κ²°κ³Όλ₯Ό 좜λ ₯해라”
  • “이 μž‘μ—…μ„ 100번 λ°˜λ³΅ν•΄λΌ”

이런 μ§€μ‹œλ₯Ό μ‚¬λžŒμ΄ 이해할 수 μžˆλŠ” μ–Έμ–΄λ‘œ μ μ–΄μ£ΌλŠ” 것이 λ°”λ‘œ ν”„λ‘œκ·Έλž˜λ°μž…λ‹ˆλ‹€.


3. νŒŒμ΄μ¬μ€ μ™œ μ΄ˆλ³΄μžμ—κ²Œ 쒋은 언어인가?

파이썬(Python)은 λ‹€μŒκ³Ό 같은 νŠΉμ§•μ„ κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€.

β‘  문법이 읽기 쉽닀

print("Hello")

Google Colab μ‹€ν–‰ ν™”λ©΄

  • μ˜μ–΄ λ¬Έμž₯처럼 μ½νžŒλ‹€
  • κΈ°ν˜Έκ°€ 적고, λ³΅μž‘ν•˜μ§€ μ•Šλ‹€

β‘‘ 데이터 뢄석에 νŠΉν™”λœ μ–Έμ–΄λ‹€

  • 엑셀보닀 λ§Žμ€ 데이터λ₯Ό λ‹€λ£° 수 μžˆλ‹€
  • μžλ™ 계산, μžλ™ 정리, μžλ™ μ‹œκ°ν™”κ°€ κ°€λŠ₯ν•˜λ‹€

β‘’ μ‹€λ¬΄μ—μ„œ 많이 μ‚¬μš©λœλ‹€

  • 데이터 뢄석가
  • λ§ˆμΌ€ν„°
  • 기획자
  • μ„œλΉ„μŠ€ 운영자

즉, νŒŒμ΄μ¬μ€ μ „κ³΅μžλ§Œμ„ μœ„ν•œ μ–Έμ–΄κ°€ μ•„λ‹ˆλ‹€.


4. 데이터 λΆ„μ„μ΄λž€ 무엇인가?

❌ 데이터 뢄석이 μ•„λ‹Œ 것

  • “λŠλ‚Œμƒ 였늘 방솑 잘 된 것 κ°™μ•„μš””
  • “μ‚¬λžŒλ“€μ΄ 많이 μ’‹μ•„ν•œ 것 κ°™μ•„μš””

βœ… 데이터 λΆ„μ„μ΄λž€

μˆ«μžμ™€ 데이터λ₯Ό 근거둜 상황을 μ„€λͺ…ν•˜κ³  νŒλ‹¨ν•˜λŠ” 것

πŸŽ₯ 라이브컀머슀 μ˜ˆμ‹œλ‘œ μ΄ν•΄ν•˜κΈ°

μ•„λž˜ 두 λ¬Έμž₯을 비ꡐ해 보자.

❌ “였늘 방솑 λ°˜μ‘ μ’‹μ•˜μ–΄μš””
βœ… “였늘 방솑은
  • μ‹œμ²­μž μˆ˜κ°€ μ–΄μ œ λŒ€λΉ„ 18% μ¦κ°€ν–ˆκ³ 
  • ꡬ맀 μ „ν™˜μœ¨μ΄ 2.3% → 3.1%둜 μƒμŠΉν–ˆμŠ΅λ‹ˆλ‹€”

두 번째 λ¬Έμž₯은 데이터 뢄석 κ²°κ³Όμž…λ‹ˆλ‹€.

πŸ“Œ 데이터 λΆ„μ„μ˜ μ—­ν• 

  • 감정을 쀄이고
  • κ·Όκ±°λ₯Ό λ§Œλ“€κ³ 
  • λ‹€μŒ 행동을 κ²°μ •ν•˜κ²Œ ν•œλ‹€

5. 이 κ°•μ’Œμ—μ„œ λ‹€λ£¨λŠ” λ²”μœ„

이 μ‹œλ¦¬μ¦ˆμ—μ„œλŠ” λ‹€μŒμ„ λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€.

  • 파이썬 문법을 μ²˜μŒλΆ€ν„° μ°¨κ·Όμ°¨κ·Ό
  • 데이터λ₯Ό 읽고, μ •λ¦¬ν•˜κ³ , μš”μ•½ν•˜κ³ , λ³΄μ—¬μ£ΌλŠ” λ‹¨κ³„κΉŒμ§€

❗ 톡계학, λ¨Έμ‹ λŸ¬λ‹μ€ 닀루지 μ•ŠμŠ΅λ‹ˆλ‹€

→ λ‹€μŒ 단계 ν•™μŠ΅μ„ μœ„ν•œ 기초 체λ ₯에 μ§‘μ€‘ν•©λ‹ˆλ‹€.


6. 개발 ν™˜κ²½: Google Colab을 μ‚¬μš©ν•˜λŠ” 이유

βœ” Google Colabμ΄λž€?

  • κ΅¬κΈ€μ—μ„œ μ œκ³΅ν•˜λŠ” 온라인 파이썬 μ‹€μŠ΅ ν™˜κ²½
  • μ„€μΉ˜ ν•„μš” μ—†μŒ
  • 둜그인만 ν•˜λ©΄ λ°”λ‘œ μ‚¬μš© κ°€λŠ₯

βœ” μ΄ˆλ³΄μžμ—κ²Œ 쒋은 이유

  • 였λ₯˜κ°€ λ‚˜λ„ λ‹€μ‹œ μ‹€ν–‰ κ°€λŠ₯
  • μ½”λ“œ + μ„€λͺ…을 ν•œ ν™”λ©΄μ—μ„œ 관리
  • μ‹€μŠ΅ 쀑심 ν•™μŠ΅μ— μ΅œμ ν™”

7. μ‹€μŠ΅ β‘  : “코딩을 ν•΄λ³Έ λŠλ‚Œ” 가져보기

πŸ“Œ λͺ©ν‘œ

  • 파이썬 μ½”λ“œκ°€ μ–΄λ–»κ²Œ μ‹€ν–‰λ˜λŠ”μ§€ 감으둜 μ΄ν•΄ν•˜κΈ°

 

β‘  μˆ˜λ„μ½”λ“œ (생각 λ¨Όμ € μ •λ¦¬ν•˜κΈ°)

μˆ˜λ„μ½”λ“œ(Pseudocode):
νŠΉμ • ν”„λ‘œκ·Έλž˜λ° μ–Έμ–΄μ˜ 문법에 얽맀이지 μ•Šκ³ , ν”„λ‘œκ·Έλž¨μ˜ 논리적 흐름을 μ‚¬λžŒμ΄ μ΄ν•΄ν•˜κΈ° μ‰¬μš΄ μžμ—°μ–΄(ν•œκ΅­μ–΄, μ˜μ–΄ λ“±)와 ν”„λ‘œκ·Έλž˜λ° μ–Έμ–΄μ˜ ν‚€μ›Œλ“œ(if, while λ“±)λ₯Ό ν˜Όν•©ν•˜μ—¬ λ‹¨κ³„λ³„λ‘œ ν‘œν˜„ν•œ 'κ°€μ§œ μ½”λ“œ' λ˜λŠ” 'μœ μ‚¬ μ½”λ“œ'

μ»΄ν“¨ν„°μ—κ²Œ
"μ•ˆλ…•ν•˜μ„Έμš”, 파이썬!" μ΄λΌλŠ” κΈ€μžλ₯Ό
화면에 보여달라고 μ‹œν‚¨λ‹€
ν•¨μˆ˜ μΈμ‚¬ν•˜κΈ°(이름)
  λ§Œμ•½ 이름이 λΉ„μ–΄μžˆμ§€ μ•Šλ‹€λ©΄
    "μ•ˆλ…•ν•˜μ„Έμš”, " + 이름 + "λ‹˜!" 좜λ ₯
  μ•„λ‹ˆλ©΄
    "이름을 μž…λ ₯ν•΄μ£Όμ„Έμš”." 좜λ ₯
  끝

β‘‘ μ‹€μ œ μ½”λ“œ

print("μ•ˆλ…•ν•˜μ„Έμš”, 파이썬!")

β‘’ μ½”λ“œ μ„€λͺ…

  • print
    → “좜λ ₯ν•˜λ‹€”λΌλŠ” 뜻
  • "μ•ˆλ…•ν•˜μ„Έμš”, 파이썬!"
    → 화면에 보여쀄 λ¬Έμž₯, λ¬Έμžμ—΄μ„ μž‘μ€λ”°μ˜΄ν‘œ('')μ•ˆμ— λ“€μ–΄κ°€ μžˆμ–΄μ•Ό ν•œλ‹€.

β‘£ μ‹€ν–‰ μˆœμ„œ (Line by Line)

  1. νŒŒμ΄μ¬μ€ printλΌλŠ” λͺ…령을 λ³Έλ‹€
  2. κ΄„ν˜Έ μ•ˆμ˜ λ‚΄μš©μ„ ν™•μΈν•œλ‹€
  3. ν•΄λ‹Ή λ¬Έμžμ—΄μ„ 화면에 좜λ ₯ν•œλ‹€

πŸ‘‰ μ½”λ“œλŠ” μœ„μ—μ„œ μ•„λž˜λ‘œ, ν•œ 쀄씩 μ‹€ν–‰λœλ‹€


8. 초보자λ₯Ό μœ„ν•œ ν•„μˆ˜ 단어 정리 (이번 μž₯)

  • print
    → “좜λ ₯ν•˜λ‹€”λΌλŠ” 뜻
  • "μ•ˆλ…•ν•˜μ„Έμš”, 파이썬!"
    → 화면에 보여쀄 λ¬Έμž₯
μš©μ–΄ 뜻
μ½”λ“œ(Code) μ»΄ν“¨ν„°μ—κ²Œ λ‚΄λ¦¬λŠ” λͺ…λ Ή
좜λ ₯(Print) 화면에 보여주기
λ¬Έμžμ—΄(String) κΈ€μž 데이터, λ¬Έμžμ—΄μ„ μž‘μ€λ”°μ˜΄ν‘œ('')μ•ˆμ— λ“€μ–΄κ°€ μžˆμ–΄μ•Ό ν•œλ‹€.
μ‹€ν–‰ μ½”λ“œλ₯Ό μ‹€μ œλ‘œ λ™μž‘μ‹œν‚€λŠ” 것

 


9. 였늘 배운 λ‚΄μš© 정리

  • ν”„λ‘œκ·Έλž˜λ°μ€ μ»΄ν“¨ν„°μ—κ²Œ 일을 μ‹œν‚€λŠ” 방법이닀
  • νŒŒμ΄μ¬μ€ 쉽고, 데이터 뢄석에 κ°•ν•˜λ‹€
  • 데이터 뢄석은 감이 μ•„λ‹ˆλΌ 근거둜 λ§ν•˜λŠ” 것
  • Google Colab은 μ΄ˆλ³΄μžμ—κ²Œ 졜적의 μ‹€μŠ΅ ν™˜κ²½μ΄λ‹€

πŸ§ͺ Chapter 01 μ’…ν•© μ‹€μŠ΅ 과제 (μ‹€λ¬΄ν˜•)

πŸ“Œ 과제 μ„€λͺ…

Google Colabμ—μ„œ μ•„λž˜ λ¬Έμž₯을 각각 ν•œ 쀄씩 좜λ ₯ν•΄λ³΄μ„Έμš”.

였늘 방솑 데이터 뢄석을 μ‹œμž‘ν•©λ‹ˆλ‹€.
λ°μ΄ν„°λ‘œ λ§ν•˜λŠ” μ‚¬λžŒμ΄ λ˜κ² μŠ΅λ‹ˆλ‹€.

 

  1. print()λ₯Ό μ‚¬μš©ν•œλ‹€
  2. λ¬Έμž₯을 κ·ΈλŒ€λ‘œ 좜λ ₯ν•œλ‹€
  3. μ‹€ν–‰ κ²°κ³Όλ₯Ό 직접 ν™•μΈν•œλ‹€

πŸ’‘ν’€μ΄

방법1) print('λ¬Έμžμ—΄') λ‘ μ€„λ‘œ λ‚˜λˆ μ„œ μ“°κΈ°

print('였늘 방솑 데이터 뢄석을 μ‹œμž‘ν•©λ‹ˆλ‹€.')
print('λ°μ΄ν„°λ‘œ λ§ν•˜λŠ” μ‚¬λžŒμ΄ λ˜κ² μŠ΅λ‹ˆλ‹€.')

방법2) \n μ‚¬μš©ν•˜κΈ°

print('였늘 방솑 데이터 뢄석을 μ‹œμž‘ν•©λ‹ˆλ‹€. \n λ°μ΄ν„°λ‘œ λ§ν•˜λŠ” μ‚¬λžŒμ΄ λ˜κ² μŠ΅λ‹ˆλ‹€.')