์ŠคํŒŒ๋ฅดํƒ€ ๋‚ด์ผ๋ฐฐ์›€์บ ํ”„(25.12.01~)

์ŠคํŒŒ๋ฅดํƒ€ ๋‚ด์ผ๋ฐฐ์›€์บ ํ”„_๋ณธ์บ ํ”„_data11๊ธฐ ๊น€์„ ์˜_TIL_Day 33

0๏ธโƒฃ 2026. 2. 6. 21:56

[์˜ค๋Š˜์˜ ํ•™์Šต]

  • [Basic] ํ†ต๊ณ„ 3~4ํšŒ์ฐจ
  • ๊ฐ•์˜: ๊ธฐ์ดˆ ํ†ต๊ณ„ํ•™

๋‚ด๋ฐฐ์บ  ์‹œ์ž‘ ์ดˆ๋ฐ˜์— ๊ธฐ์ดˆ ํ†ต๊ณ„ํ•™ ๊ฐ•์˜ ๋“ค์—ˆ์„ ๋•Œ๋Š” ์ง„์งœ ํ•˜๋‚˜๋„ ๋ชป ์•Œ์•„ ๋“ค์—ˆ๋Š”๋ฐ ํŒ๋‹ค์Šค, ์‹œ๊ฐํ™”, ํ†ต๊ณ„ ๋“ฑ ๋ผ์ด๋ธŒ ์„ธ์…˜์„ ๋“ฃ๊ณ  ๋‚˜์„œ ๊ฐ•์˜๋“ค์œผ๋‹ˆ๊นŒ ๋งŽ์€ ๋ถ€๋ถ„์„ ์•Œ์•„๋“ฃ๊ณ  ์žˆ์—ˆ๋‹ค.

๊ฐ๊ณ„๋ฌด๋Ÿ‰ ๐Ÿ˜ญ
์„ฑ์žฅ์„ ๋А๋‚„ ์ˆ˜ ์žˆ๋Š” ํ•˜๋ฃจ์˜€๋‹ค โญ๏ธ


[ํ•™์Šต๋‚ด์šฉ ์ •๋ฆฌ]

# [Basic] ํ†ต๊ณ„ 3~4ํšŒ์ฐจ ๋ผ์ด๋ธŒ ์„ธ์…˜

  • ์‚ฐํฌ๋„ ๊ตฌํ•˜๊ธฐ (ํŽธ์ฐจ, ๋ถ„์‚ฐ, ํ‘œ์ค€ํŽธ์ฐจ)
    : ๋ฐ์ดํ„ฐ๊ฐ€ ํ‰๊ท  ๊ทผ์ฒ˜์— ๋ชฐ๋ ค ์žˆ๋Š”์ง€, ํผ์ ธ ์žˆ๋Š”์ง€ ๊ทธ ์ •๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ.

์–ด์ฉ” ์ˆ˜ ์—†๋Š” ๋ฐ”๋ณด๋ผ์„œ ์—ฌ๊ธฐ๊นŒ์ง€ ์˜ด....

https://youtu.be/naJQNDMbViY?si=6YQXnDkP-pMtVOAw

 

 

  • ๋ถ„์‚ฐ vs ํ‘œ์ค€ํŽธ์ฐจ
    -> ๋ณธ์งˆ์ ์ธ ์˜๋ฏธ(ํผ์ง์˜ ์ •๋„)๋Š” ๊ฐ™์ง€๋งŒ, ์šฐ๋ฆฌ๊ฐ€ ์ฒด๊ฐํ•˜๋Š” ๋А๋‚Œ์€ ํ‘œ์ค€ํŽธ์ฐจ๊ฐ€ ํ›จ์”ฌ ์ •ํ™•
    -> ์ด๋•Œ ์‚ฌ์šฉ๋˜๋Š” ํ‰๊ท ์€ ์ˆœ์ˆ˜ ์‚ฐ์ˆ  ํ‰๊ท  (์ˆœ์ˆ˜ํ•œ ๋ฐ์ดํ„ฐ๋กœ ๊ตฌํ•œ ํ‰๊ท )
    • ๋ถ„์‚ฐ์„ ์“ฐ๋Š” ์ด์œ : ๋ฐ์ดํ„ฐ์™€ ํ‰๊ท ์˜ ์ฐจ์ด(ํŽธ์ฐจ)๋ฅผ ๊ทธ๋ƒฅ ๋”ํ•˜๋ฉด ํ•ฉ์ด 0์ด ๋˜์–ด๋ฒ„๋ฆฝ๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ ์ฐจ์ด๋ฅผ ์ œ๊ณฑํ•˜์—ฌ ํ•ฉ์‚ฐํ•˜๋ฉฐ, ์ด ๊ณผ์ •์—์„œ ์ˆ˜ํ•™์ ์œผ๋กœ ๋‹ค๋ฃจ๊ธฐ ์‰ฌ์šด ์„ฑ์งˆ์„ ๊ฐ–๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
    • ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ ์“ฐ๋Š” ์ด์œ : ๋ถ„์‚ฐ์€ ์ œ๊ณฑ์„ ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์ˆ˜์น˜๊ฐ€ ๋„ˆ๋ฌด ์ปค์ง€๊ณ  ๋‹จ์œ„๋„ ๋ณ€ํ•ฉ๋‹ˆ๋‹ค(์˜ˆ: 'ํ‚ค'๋ฅผ ๊ณ„์‚ฐํ•˜๋Š”๋ฐ ๋‹จ์œ„๊ฐ€ (cm^{2})๊ฐ€ ๋จ). ์ด๋ฅผ ๋‹ค์‹œ ๋ฃจํŠธ๋กœ ๋˜๋Œ๋ ค ๋†“์œผ๋ฉด ์›๋ž˜ ๋ฐ์ดํ„ฐ์™€ ๊ฐ™์€ ์Šค์ผ€์ผ๋กœ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์–ด ํ›จ์”ฌ ์ง๊ด€์ ์ž…๋‹ˆ๋‹ค
๊ตฌ๋ถ„ ๋ถ„์‚ฐ ํ‘œ์ค€ํŽธ์ฐจ
์ •์˜ ํŽธ์ฐจ(๊ด€์ธก๊ฐ’-ํ‰๊ท )๋ฅผ ์ œ๊ณฑํ•œ ๊ฐ’๋“ค์˜ ํ‰๊ท  ๋ถ„์‚ฐ์— ์ œ๊ณฑ๊ทผ(๋ฃจํŠธ)์„ ์”Œ์šด ๊ฐ’
๋‹จ์œ„ ์›๋ž˜ ๋ฐ์ดํ„ฐ ๋‹จ์œ„์˜ ์ œ๊ณฑ (์˜ˆ: (cm^{2})) ์›๋ž˜ ๋ฐ์ดํ„ฐ์™€ ๋™์ผ (์˜ˆ: (cm))
์šฉ๋„ ํ†ต๊ณ„์  ์ด๋ก  ์ „๊ฐœ ๋ฐ ์ˆ˜์‹ ๊ณ„์‚ฐ ์‹œ ํŽธ๋ฆฌ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋ฅผ ์ง๊ด€์ ์œผ๋กœ ํŒŒ์•…ํ•  ๋•Œ ์œ ์šฉ
  • ์ถ”๋ก ํ†ต๊ณ„
    1. ์ƒ˜ํ”Œ๋ง: ๋ชจ์ง‘๋‹จ์˜ ์ผ๋ถ€๋กœ ์ƒ˜ํ”Œ(ํ‘œ๋ณธ)์„ ๋งŒ๋“ฆ
    2. ํ‘œ๋ณธ์„ ๋ถ„์„ํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์–ป์Œ. = ํ†ต๊ณ„๋Ÿ‰
    3. ํ†ต๊ณ„๋Ÿ‰์œผ๋กœ ๋ชจ์ˆ˜(ํŒŒ๋ผ๋ฏธํ„ฐ)๋ฅผ ์ถ”์ •ํ•จ.

 

  • ์ด์‚ฐํ˜• ๋ถ„ํฌ
    • ํ™•๋ฅ ๋ณ€์ˆ˜๊ฐ€ ์œ ํ•œํ•˜๊ฑฐ๋‚˜ ์…€ ์ˆ˜ ์žˆ๋Š”(๊ฐ€์‚ฐ) ๊ฐ’์„ ๊ฐ€์งˆ ๋•Œ, ๊ฐ ๊ฐ’์— ๋Œ€์‘ํ•˜๋Š” ํ™•๋ฅ (ex. ์ฃผ์‚ฌ์œ„, ๋™์ „ ๋˜์ง€๊ธฐ)
      • ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ: 1ํšŒ ์‹œํ–‰์—์„œ ์„ฑ๊ณต(1) ์•„๋‹ˆ๋ฉด ์‹คํŒจ(0)๋งŒ ๋‚˜์˜ค๋Š” ๊ฒฝ์šฐ (์˜ˆ: ๋™์ „ ๋˜์ง€๊ธฐ).
      • ์ดํ•ญ ๋ถ„ํฌ (Binomial Distribution): ๋…๋ฆฝ์ ์ธ ๋ฒ ๋ฅด๋ˆ„์ด ์‹œํ–‰์„ n๋ฒˆ ๋ฐ˜๋ณตํ–ˆ์„ ๋•Œ ์„ฑ๊ณต ํšŸ์ˆ˜์˜ ๋ถ„ํฌ (์˜ˆ: 10๋ฒˆ ์ค‘ ์•ž๋ฉด ํšŸ์ˆ˜). (A/B ํ…Œ์ŠคํŠธ์— ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๊ฐœ๋…)
  • ์—ฐ์†ํ˜• ๋ถ„ํฌ
    • ์ •๊ทœ๋ถ„ํฌ (Normal Distribution): 'ํ‰๊ท '๊ณผ '๋ถ„์‚ฐ'์„ ๋ชจ์ˆ˜๋กœ ํ•˜๋Š” ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์ธ ๋ถ„ํฌ๋กœ, ์‹ค์ œ ์ž์—ฐ/์‚ฌํšŒ ํ˜„์ƒ์„ ์„ค๋ช…ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ.
      • ํŠน์ง•:
        - ๊ฐ€์šด๋ฐ๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋Œ€์นญ
        - ํ‘œ์ค€ํ™” ๊ฐ€๋Šฅ
    • t-๋ถ„ํฌ (t-Distribution): ์ •๊ทœ๋ถ„ํฌ์™€ ์œ ์‚ฌํ•˜๋‚˜ ํ‘œ๋ณธ ํฌ๊ธฐ๊ฐ€ ์ž‘์„ ๋•Œ ํ‰๊ท  ์ถ”์ •์— ์‚ฌ์šฉ

# [๊ฐ•์˜] ๊ธฐ์ดˆ ํ†ต๊ณ„ํ•™

  • ์‹œ๊ฐํ™” Histogram vs Plot
    • Histogram: ์ˆ˜์น˜ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ์‹œ๊ฐํ™” ํ•  ๋•Œ ์‚ฌ์šฉํ•จ.
      x์ถ•์˜ ๋ฒ”์œ„(๋ฒ”์ฃผ)๋ฅผ ์ •ํ•ด์„œ ์‚ฌ์šฉํ•จ
    • Plot: ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ, ์ด์‚ฐํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ์‹œ๊ฐํ™” ํ•  ๋•Œ ์‚ฌ์šฉํ•จ.
      x์ถ•์— ์˜ฌ ์œ ํ•œ์˜ ๊ฐ’์ด ์ •ํ•ด์ ธ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ฒ”์œ„๋ฅผ ์ง€์ •ํ•˜์ง€ ์•Š๊ณ  ์‚ฌ์šฉํ•จ.
  • ์ƒ๊ด€๊ด€๊ณ„
    • ์–‘์˜ ์ƒ๊ด€๊ด€๊ณ„(Positive Correlation) : ๋‘ ๋ฐ์ดํ„ฐ์˜ ๊ฐ’์ด ๊ฐ™์€ ๋ฐฉํ–ฅ์œผ๋กœ ๋ณ€ํ™”ํ•จ.
    • ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„(Negative Correlation) : ๋‘ ๋ฐ์ดํ„ฐ์˜ ๊ฐ’์ด ๋‹ค๋ฅธ ๋ฐฉํ–ฅ์œผ๋กœ ๋ณ€ํ™”ํ•จ.
    • ์ƒ๊ด€๊ณ„์ˆ˜ : ๋‘ ๋ฐ์ดํ„ฐ์˜ ๊ด€๊ณ„์˜ ๊ฐ•๋„๋ฅผ ์ˆซ์ž๋กœ ํ‘œํ˜„ํ•œ ๊ฒƒ. -1๊ณผ 1 ์‚ฌ์ด์˜ ๊ฐ’์œผ๋กœ ๋‚˜ํƒ€๋ƒ„.
์ƒ๊ด€๊ณ„์ˆ˜ -1 -0.4 0 0.4 1
์˜๋ฏธ ๊ฐ•ํ•œ ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„ ์•ฝํ•œ ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„ ๊ด€๊ณ„ ์—†์Œ ์•ฝํ•œ ์–‘์˜ ์ƒ๊ด€๊ด€๊ณ„ ๊ฐ•ํ•œ ์–‘์˜ ์ƒ๊ด€๊ด€๊ณ„