סטטיסטיקה
והסתברות
חוברת מדריך למתחילים
גם אם אף פעם לא הבנת — החוברת הזאת תיקח אותך מאפס
עד רמה של בגרות 4 יחידות לימוד
📊 8 פרקים
✏️ דוגמאות מפורטות
🎯 תרגילי בדיקה
📖 כיתה י"א
שלום!
החוברת הזאת נכתבה במיוחד בשבילך — התלמיד שמגיע לסטטיסטיקה ומרגיש שזה "סינית". אל דאגה. עד סוף החוברת תבין הכל.
איך להשתמש בחוברת:
- אל תדלג. כל פרק בונה על הקודם.
- תסמן במרקר את הנוסחאות — הן חוזרות בבגרות.
- אחרי כל פרק יש קופסת "עצור וחשוב" — תענה ואז תבדוק.
- בסוף יש דף נוסחאות מסכם + 3 תרגילי בגרות.
מה נלמד בפנים?
- מדדי מרכז: ממוצע, חציון, שכיח
- פיזור: שונות וסטיית תקן
- ציון תקן (Z) — להשוות בין דברים שונים
- הסתברות: הבסיס
- הסתברות מותנית ועץ הסתברות
- התפלגות בינומית
- התפלגות נורמלית
- רגרסיה לינארית ומקדם מתאם
עוד לא נעזר במחשבון? עכשיו הזמן. מחשבון מדעי פשוט יספיק לכל מה שנלמד.
1ממוצע, חציון, שכיח
שלושה מדדי "מרכז" — שלוש דרכים לענות על השאלה: "איפה הנתונים נמצאים באמצע?"
1.1 ממוצע (Mean)
באת הביתה עם תעודה: 70, 80, 90, 85, 75, 100. אמא שואלת "איך אתה בכללי?" —
אתה עונה: "בממוצע 83". איך חישבת? סכמת הכל וחילקת ב-6.
נוסחת הממוצע
$\bar{x} = \dfrac{x_1 + x_2 + \ldots + x_n}{n} = \dfrac{\sum x_i}{n}$
פשוט: סכום כל הערכים חלקי כמות הערכים. זהו.
נתונים: 70, 80, 90, 85, 75, 100
סכום: 70+80+90+85+75+100 = 500
כמות: n = 6
ממוצע: 500 ÷ 6 ≈ 83.33
1.2 חציון (Median)
חמישה חברים עומדים בשורה לפי גובה. מי באמצע? — החציון.
איך מוצאים חציון?
1
ממיינים את הנתונים מהקטן לגדול.
2
אם n אי-זוגי — החציון הוא הערך באמצע.
3
אם n זוגי — החציון הוא ממוצע של שני הערכים האמצעיים.
נתונים: 70, 80, 90, 85, 75, 100
אחרי מיון: 70, 75, 80, 85, 90, 100
n=6 (זוגי) → שני אמצעיים הם 80 ו-85
חציון = (80+85)/2 = 82.5
1.3 שכיח (Mode)
הערך שמופיע הכי הרבה פעמים. פשוט.
נתונים: 3, 5, 5, 7, 8, 8, 8, 9
המספר 8 מופיע 3 פעמים — הכי הרבה.
שכיח = 8
1.4 מתי משתמשים במה?
| מתי? | במה להשתמש? |
| אין ערכים חריגים, נתונים רגילים | ממוצע |
| יש ערכים חריגים מאד (למשל: 1, 2, 3, 4, 1000) | חציון |
| נתונים לא מספריים (צבעים, סוגים) | שכיח |
ערכים חריגים מעוותים את הממוצע! לדוגמה, אם במשרד 10 אנשים מרוויחים 10,000 ש"ח
והמנכ"ל מרוויח 200,000 — הממוצע יקפוץ ל-27,000, אבל החציון יישאר 10,000.
לכן לעיתים חציון "מספר יותר אמת".
1.5 ממוצע משוקלל
כשלכל ערך יש "משקל" שונה (כמה פעמים הוא מופיע):
ממוצע משוקלל
$\bar{x} = \dfrac{\sum f_i x_i}{\sum f_i}$
כאן $f_i$ = השכיחות (משקל) של הערך $x_i$.
ציונים בכיתה:
ציון 70 — 5 תלמידים
ציון 80 — 10 תלמידים
ציון 90 — 5 תלמידים
ממוצע = (70·5 + 80·10 + 90·5) / (5+10+5) = 1600 / 20 = 80
נתונים: 4, 6, 6, 8, 10, 10, 10, 12. מצא ממוצע, חציון ושכיח.
ממוצע = (4+6+6+8+10+10+10+12)/8 = 66/8 = 8.25 · חציון = (8+10)/2 = 9 · שכיח = 10
2שונות וסטיית תקן
איך מודדים עד כמה הנתונים "מפוזרים"?
2.1 הבעיה: ממוצע זה לא מספיק
שתי כיתות עשו מבחן. שתיהן קיבלו ממוצע 80. האם הכיתות זהות?
כיתה א': 75, 78, 80, 82, 85 — כולם קרובים ל-80.
כיתה ב': 40, 60, 80, 100, 120 — פיזור ענק!
שני ממוצעים זהים — אבל פיזור הפוך לחלוטין.
סטיית תקן מודדת כמה הנתונים מפוזרים סביב הממוצע. קטנה = מרוכזים, גדולה = פזורים.
2.2 איך מחשבים? (הנוסחה הבסיסית)
שונות
$\sigma^2 = \dfrac{\sum (x_i - \bar{x})^2}{n}$
סטיית תקן
$\sigma = \sqrt{\sigma^2}$
הסבר צעד-צעד:
2
לכל ערך מחשבים את ההפרש מהממוצע: $(x_i - \bar{x})$.
3
מעלים בריבוע (כדי שההפרשים השליליים לא יבטלו את החיוביים).
4
ממוצע של הריבועים — זו השונות $\sigma^2$.
5
שורש → סטיית תקן $\sigma$.
נתונים: 2, 4, 4, 4, 5, 5, 7, 9
ממוצע: (2+4+4+4+5+5+7+9)/8 = 40/8 = 5
הפרשים בריבוע:
(2-5)² = 9, (4-5)² = 1 (×3), (4-5)² , (5-5)²=0 (×2), (7-5)²=4, (9-5)²=16
סכום: 9 + 1+1+1 + 0+0 + 4 + 16 = 32
שונות: 32/8 = 4
סטיית תקן: √4 = 2
2.3 נוסחה שימושית (חוסכת עבודה)
נוסחה חלופית לשונות
$\sigma^2 = \overline{x^2} - \bar{x}^2$
כלומר: ממוצע הריבועים פחות ריבוע הממוצע.
הנוסחה הזו הרבה יותר מהירה — במקום לחשב הפרשים, פשוט מחשבים ממוצע הריבועים וריבוע הממוצע.
על אותם נתונים: 2, 4, 4, 4, 5, 5, 7, 9
ריבועים: 4, 16, 16, 16, 25, 25, 49, 81
ממוצע הריבועים: 232/8 = 29
ריבוע הממוצע: 5² = 25
שונות: 29 - 25 = 4 ✓ (זהה לתשובה הקודמת!)
2.4 תכונות חשובות (חוקי תקנון)
אם מוסיפים קבוע $c$ לכל ערך:
• הממוצע גדל ב-$c$
• סטיית התקן לא משתנה
אם מכפילים כל ערך ב-קבוע $a$:
• הממוצע מוכפל ב-$a$
• סטיית התקן מוכפלת ב-$|a|$
ממוצע הציונים בכיתה הוא 70 וסטיית התקן 8. המורה מחליט להוסיף 5 נקודות לכל תלמיד. מה הממוצע והסטייה החדשים?
ממוצע חדש: 70+5 = 75 · סטיית תקן: נשארת 8 (קבוע לא משפיע על פיזור)
3ציון תקן (Z-score)
איך להשוות בין "תפוחים לתפוזים".
3.1 הבעיה
קיבלת 85 במבחן מתמטיקה ו-75 במבחן אנגלית. באיזה מבחן הצלחת יותר?
לא מספיק להסתכל על הציונים — צריך לדעת איך המבחנים ביחס לכיתה.
3.2 הפתרון: ציון תקן
ציון תקן ($Z$) אומר כמה סטיות תקן הערך שלך רחוק מהממוצע.
ציון תקן
$Z = \dfrac{x - \mu}{\sigma}$
- $Z > 0$ — אתה מעל הממוצע
- $Z < 0$ — אתה מתחת לממוצע
- $Z = 0$ — אתה בדיוק על הממוצע
- $|Z|$ גדול — אתה רחוק מהממוצע (חריג)
מתמטיקה: ציון 85, ממוצע כיתה 80, סטיית תקן 5
$Z_{\text{מתמטיקה}} = (85-80)/5 = 1$
→ סטיית תקן אחת מעל הממוצע.
אנגלית: ציון 75, ממוצע כיתה 65, סטיית תקן 5
$Z_{\text{אנגלית}} = (75-65)/5 = 2$
→ סטיית תקן שתיים מעל הממוצע.
מסקנה: באנגלית הצלחת יותר ביחס לכיתה! ✨
3.3 למה זה כל כך חשוב?
ציון תקן יופיע בכל שאלה על התפלגות נורמלית בבגרות. ממירים את הערכים ל-Z, ואז משתמשים בטבלת $Z$ כדי לדעת הסתברויות. נראה בפרק 7.
גובהי תלמידים בכיתה: ממוצע 168 ס"מ, סטיית תקן 6 ס"מ. דני גבוה 180. מה ציון התקן שלו?
Z = (180-168)/6 = 12/6 = 2 — דני נמצא 2 סטיות תקן מעל הממוצע
4הסתברות — הבסיס
מה הסיכוי שמשהו יקרה? כל הכללים שצריך.
4.1 הגדרה
זורקים מטבע. יש 2 תוצאות אפשריות (עץ/פלי). התוצאה "עץ" היא 1 מתוך 2.
ההסתברות ל-"עץ" = 1/2 = 0.5 = 50%.
הסתברות קלאסית
$P(A) = \dfrac{\text{מספר תוצאות רצויות}}{\text{סך כל התוצאות}}$
- הסתברות תמיד בין 0 ל-1 (או 0% ל-100%)
- $P = 0$ → בלתי אפשרי · $P = 1$ → בטוח
- סכום כל ההסתברויות של האפשרויות = 1
4.2 משלים
המשלים של $A$ (מסומן $\bar{A}$) = כל מה שלא $A$.
$P(\bar{A}) = 1 - P(A)$
זורקים קובייה — מה ההסתברות לא לקבל 6?
$P(6) = 1/6$ → $P(\text{לא } 6) = 1 - 1/6 = 5/6$
4.3 איחוד — "או"
$P(A \cup B)$ = ההסתברות ש-A או B (או שניהם) יקרו.
$P(A \cup B) = P(A) + P(B) - P(A \cap B)$
אם $A$ ו-$B$ זרים (לא יכולים לקרות ביחד): $P(A \cup B) = P(A) + P(B)$.
קובייה — מה ההסתברות לקבל 2 או 5?
הם זרים → $P = 1/6 + 1/6 = 2/6 = 1/3$
4.4 חיתוך — "גם וגם"
$P(A \cap B)$ = ההסתברות ש-A וגם B יקרו.
אם $A$ ו-$B$ בלתי תלויים:
$P(A \cap B) = P(A) \cdot P(B)$
בלתי תלויים = A לא משפיע על B. לדוגמה: שתי זריקות של מטבע.
זה לא אותו דבר כמו "זרים"!
זורקים 2 מטבעות — מה ההסתברות ששניהם עץ?
$P = (1/2) \cdot (1/2) = 1/4$
זורקים קובייה. מה ההסתברות לקבל מספר זוגי או גדול מ-4?
זוגי = {2,4,6} → 3/6. גדול מ-4 = {5,6} → 2/6. חיתוך (זוגי וגם >4) = {6} → 1/6.
איחוד = 3/6 + 2/6 − 1/6 = 4/6 = 2/3
5הסתברות מותנית ועץ הסתברות
מה ההסתברות ל-A בהינתן שB כבר קרה?
5.1 המושג
בקופסה 10 כדורים: 6 אדומים, 4 כחולים. הוצאת כדור אדום ולא החזרת.
בהינתן שהוצאת אדום — מה הסיכוי שהכדור הבא יהיה אדום?
עכשיו נשארו 9 כדורים, 5 אדומים. לכן: 5/9.
הסתברות מותנית
$P(A|B) = \dfrac{P(A \cap B)}{P(B)}$
קוראים: "ההסתברות ל-A בהינתן B".
5.2 כלל הכפל
$P(A \cap B) = P(B) \cdot P(A|B)$
כלומר: A וגם B = B קודם, ואז A בהינתן B.
5.3 עץ הסתברות
הטכניקה הכי חשובה בפרק הזה! מציירים עץ, כל ענף = שלב. ההסתברות בסוף ענף = מכפלת כל ההסתברויות בדרך.
דוגמה: בקופסה 3 כדורים אדומים, 2 כחולים. מוציאים 2 כדורים, אחד אחרי השני, בלי החזרה.
עץ:
• אדום ראשון: 3/5 · אדום שני בהינתן אדום: 2/4 → 3/5 · 2/4 = 6/20
• אדום ראשון: 3/5 · כחול שני בהינתן אדום: 2/4 → 3/5 · 2/4 = 6/20
• כחול ראשון: 2/5 · אדום שני בהינתן כחול: 3/4 → 2/5 · 3/4 = 6/20
• כחול ראשון: 2/5 · כחול שני בהינתן כחול: 1/4 → 2/5 · 1/4 = 2/20
סה"כ: 6+6+6+2 = 20/20 = 1 ✓ (תמיד לבדוק!)
5.4 נוסחת ההסתברות השלמה
אם אנחנו יודעים את ההסתברויות בהינתן כל "ענף":
$P(B) = P(B|A) \cdot P(A) + P(B|\bar{A}) \cdot P(\bar{A})$
5.5 נוסחת בייס
הופכת את הכיוון: ממסקנה לסיבה.
$P(A|B) = \dfrac{P(B|A) \cdot P(A)}{P(B)}$
בדיקה רפואית: 1% מהאוכלוסייה חולה. הבדיקה מזהה נכון 95% מהחולים, ומטעה (חיובי כוזב) ב-5% מהבריאים.
אדם קיבל תוצאה חיובית — מה הסיכוי שהוא באמת חולה?
$P(B) = 0.95 \cdot 0.01 + 0.05 \cdot 0.99 = 0.0095 + 0.0495 = 0.059$
$P(\text{חולה}|B) = (0.95 \cdot 0.01)/0.059 \approx 0.161$
רק 16%! מפתיע — אבל הגיוני: יש הרבה יותר בריאים, אז גם 5% מהם גדול ממספר החולים הנכון.
בקופסה 4 כדורים לבנים ו-6 שחורים. מוציאים 2 ללא החזרה. מה ההסתברות ששניהם שחורים?
$P = (6/10) \cdot (5/9) = 30/90 = $ 1/3
6התפלגות בינומית
כמה "הצלחות" יהיו כשחוזרים על אותו ניסוי כמה פעמים?
6.1 מתי משתמשים?
כאשר יש לנו ניסוי שעונה על 4 תנאים:
- $n$ ניסויים בלתי תלויים
- כל ניסוי יש לו בדיוק 2 תוצאות אפשריות (הצלחה/כשלון)
- הסתברות ההצלחה קבועה בכל ניסוי — $p$
- סופרים כמה הצלחות סה"כ — $X$
דוגמה קלאסית: זריקת מטבע 10 פעמים — כמה "עצים" יצאו?
$n=10$, $p=0.5$ (הסתברות עץ), $X$ = מספר עצים.
6.2 הנוסחה
הסתברות בדיוק ל-k הצלחות מתוך n
$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$
מה זה $\binom{n}{k}$?
"n מעל k" — כמה דרכים לבחור $k$ הצלחות מתוך $n$ ניסויים.
$\binom{n}{k} = \dfrac{n!}{k!(n-k)!}$
תזכורת: $n! = n \cdot (n-1) \cdot (n-2) \cdot \ldots \cdot 1$. למשל $5! = 120$.
זורקים מטבע 5 פעמים. מה הסיכוי לבדיוק 3 עצים?
$n=5, k=3, p=0.5$
$\binom{5}{3} = 10$
$P = 10 \cdot 0.5^3 \cdot 0.5^2 = 10 \cdot 0.125 \cdot 0.25 = \mathbf{0.3125}$
6.3 תוחלת וסטיית תקן
מה המספר הממוצע של הצלחות? מה הפיזור?
תוחלת
$E(X) = np$
שונות
$V(X) = np(1-p)$
סטיית תקן
$\sigma = \sqrt{np(1-p)}$
100 זריקות מטבע: $E(X) = 100 \cdot 0.5 = 50$ עצים בממוצע.
$\sigma = \sqrt{100 \cdot 0.5 \cdot 0.5} = \sqrt{25} = 5$.
6.4 "לפחות" / "לכל היותר" — טיפ חשוב
"לפחות 2 הצלחות":
$P(X \geq 2) = 1 - P(X=0) - P(X=1)$
קל יותר לחשב את המשלים ולהחסיר!
זורקים קובייה 4 פעמים. מה ההסתברות לקבל בדיוק 2 פעמים "6"?
$n=4, k=2, p=1/6$
$P = \binom{4}{2}(1/6)^2(5/6)^2 = 6 \cdot (1/36) \cdot (25/36) = 150/1296 \approx$ 0.1157
7התפלגות נורמלית
"הפעמון" — ההתפלגות החשובה ביותר בטבע.
7.1 מה זה?
גבהים של אנשים, ציונים בבגרות, משקלי תפוחים — הרבה מאוד דברים בטבע מתפלגים לפי עקומת פעמון:
סביב הממוצע יש הרבה, רחוק מהממוצע יש מעט.
כל התפלגות נורמלית מתוארת ב-2 פרמטרים:
- $\mu$ — ממוצע (איפה מרכז הפעמון)
- $\sigma$ — סטיית תקן (כמה רחב הפעמון)
כותבים: $X \sim N(\mu, \sigma^2)$.
7.2 כלל 68-95-99.7
• כ-68% מהנתונים בטווח $\mu \pm \sigma$ (סטייה אחת)
• כ-95% בטווח $\mu \pm 2\sigma$
• כ-99.7% בטווח $\mu \pm 3\sigma$
7.3 התפלגות נורמלית תקנית
ההתפלגות שכולם מודדים לפיה: $\mu=0, \sigma=1$. מסמנים $Z$.
תמיד ממירים את ה-X ל-Z לפני החישוב:
$Z = \dfrac{X - \mu}{\sigma}$
7.4 איך קוראים טבלת Z
הטבלה נותנת $\Phi(z) = P(Z \leq z)$ — ההסתברות ש-Z קטן או שווה ל-$z$.
כללים שימושיים:
- $P(Z > z) = 1 - \Phi(z)$
- $P(Z < -z) = 1 - \Phi(z)$ (בגלל סימטריה)
- $P(a < Z < b) = \Phi(b) - \Phi(a)$
גובהי תלמידות בכיתה ט': $\mu=160$ ס"מ, $\sigma=5$ ס"מ.
מה ההסתברות שגובהה של תלמידה אקראית יהיה בין 155 ל-170?
המרה ל-Z:
$Z_1 = (155-160)/5 = -1$
$Z_2 = (170-160)/5 = 2$
מהטבלה:
$\Phi(2) = 0.9772$
$\Phi(-1) = 1 - \Phi(1) = 1 - 0.8413 = 0.1587$
$P = 0.9772 - 0.1587 = \mathbf{0.8185}$ (כ-82%)
7.5 דגימה — ממוצע של מדגם
אם לוקחים מדגם בגודל $n$ מאוכלוסייה עם $\mu, \sigma$ — גם ממוצע המדגם $\bar{X}$ מתפלג נורמלית:
$\bar{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right)$
- אותו ממוצע $\mu$
- סטיית תקן קטנה יותר: $\dfrac{\sigma}{\sqrt{n}}$ (ככל ש-$n$ גדול, הממוצע יותר מדויק)
$X \sim N(100, 10^2)$. מה ההסתברות שממוצע של 25 תצפיות יהיה מעל 103?
$\sigma_{\bar{X}} = 10/\sqrt{25} = 2$
$Z = (103-100)/2 = 1.5$
$P = 1 - \Phi(1.5) = 1 - 0.9332 = \mathbf{0.0668}$
$X \sim N(50, 4^2)$. מה $P(X > 58)$?
$Z = (58-50)/4 = 2$. $P(Z>2) = 1 - 0.9772 = $ 0.0228
8רגרסיה לינארית ומקדם מתאם
מציאת קו ישר שיתאר את הקשר בין שני משתנים — וחיזוי ערכים חדשים.
8.1 מה זה רגרסיה?
אספת נתונים של תלמידים: כמה שעות למדו למבחן (x) והציון שקיבלו (y).
מתקבלת שאלה: האם יש קשר? ואם כן — אם דני ילמד 4.5 שעות, איזה ציון צפוי לו?
רגרסיה לינארית עונה לשתי השאלות: היא מוצאת את הקו הישר $y = ax + b$ שהכי מתאר את הנתונים.
למה שימושי?
- להבין את הקשר בין שני משתנים (חיובי? שלילי? חזק? חלש?)
- לחזות ערכים חדשים בהתבסס על הקשר שמצאנו
8.2 דיאגרמת פיזור (Scatter Plot)
לפני הכל — מציירים. כל נקודה היא תצפית אחת $(x_i, y_i)$. מסתכלים על "הצורה":
- עולה (↗): כש-x גדל, y גם גדל → קשר חיובי
- יורדת (↘): כש-x גדל, y קטן → קשר שלילי
- בלגן: אין קשר לינארי
8.3 מקדם המתאם (r)
זה המספר שמודד את חוזק וכיוון הקשר הלינארי.
מקדם המתאם
$r = \dfrac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \cdot \sum (y_i - \bar{y})^2}}$
או בנוסחה שקולה (עם שונות משותפת $\text{Cov}$):
$r = \dfrac{\text{Cov}(x,y)}{\sigma_x \cdot \sigma_y}$ , $\text{Cov}(x,y) = \overline{xy} - \bar{x}\cdot\bar{y}$
איך קוראים את r?
| ערך r | משמעות |
| r = 1 | קשר חיובי מושלם — כל הנקודות על קו עולה |
| r = -1 | קשר שלילי מושלם — כל הנקודות על קו יורד |
| r = 0 | אין קשר לינארי |
| |r| > 0.7 | קשר חזק |
| 0.3 < |r| < 0.7 | קשר בינוני |
| |r| < 0.3 | קשר חלש |
r תמיד בטווח [-1, 1]. אם חישבת וקיבלת 1.5 — יש טעות!
8.4 תכונות חשובות של r
r לא משתנה אם:
• מוסיפים קבוע לכל ה-x או לכל ה-y
• מכפילים את כל ה-x (או y) בקבוע חיובי
r מחליף סימן אם מכפילים ב-קבוע שלילי.
8.5 קו הרגרסיה y על x
הקו הישר $y = ax + b$ שממזער את סכום ריבועי ההפרשים מהנקודות (שיטת הריבועים הפחותים).
שיפוע (slope)
$a = \dfrac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2} = r \cdot \dfrac{\sigma_y}{\sigma_x}$
חיתוך עם ציר y
$b = \bar{y} - a \cdot \bar{x}$
תכונה קריטית: קו הרגרסיה תמיד עובר דרך הנקודה $(\bar{x}, \bar{y})$.
אם יש לך את המשוואה ואת $\bar{x}$ — אפשר לחלץ את $\bar{y}$ בלי חישוב נוסף!
8.6 דוגמה מלאה — חישוב מ-א' עד ת'
נתונים: 5 תלמידים — שעות לימוד (x) וציון (y):
(2, 60), (3, 70), (4, 75), (5, 85), (6, 90)
שלב 1 — ממוצעים:
$\bar{x} = (2+3+4+5+6)/5 = 4$
$\bar{y} = (60+70+75+85+90)/5 = 76$
שלב 2 — טבלת עזר:
| x | y | $x-\bar{x}$ | $y-\bar{y}$ | $(x-\bar{x})(y-\bar{y})$ | $(x-\bar{x})^2$ | $(y-\bar{y})^2$ |
| 2 | 60 | -2 | -16 | 32 | 4 | 256 |
| 3 | 70 | -1 | -6 | 6 | 1 | 36 |
| 4 | 75 | 0 | -1 | 0 | 0 | 1 |
| 5 | 85 | 1 | 9 | 9 | 1 | 81 |
| 6 | 90 | 2 | 14 | 28 | 4 | 196 |
| סה"כ | | | | 75 | 10 | 570 |
שלב 3 — שיפוע:
$a = 75/10 = \mathbf{7.5}$
שלב 4 — חיתוך:
$b = 76 - 7.5 \cdot 4 = 76 - 30 = \mathbf{46}$
משוואת קו הרגרסיה:
$\boxed{y = 7.5x + 46}$
שלב 5 — מקדם המתאם:
$r = 75 / \sqrt{10 \cdot 570} = 75 / \sqrt{5700} \approx 75/75.5 \approx \mathbf{0.993}$
→ קשר חיובי חזק מאד. כמעט מושלם!
שלב 6 — חיזוי: תלמיד למד 4.5 שעות:
$y = 7.5 \cdot 4.5 + 46 = 33.75 + 46 = \mathbf{79.75}$
8.7 חיזוי — מתי זה אמין?
חיזוי אמין רק בטווח הנתונים שיש לך.
בדוגמה: הנתונים היו 2-6 שעות. חיזוי ל-3 שעות? אמין. חיזוי ל-20 שעות? לא אמין (מחוץ לטווח).
נתון: $\bar{x}=10, \bar{y}=50, \sigma_x=2, \sigma_y=6, r=0.8$. מה משוואת קו הרגרסיה y על x?
$a = r \cdot \sigma_y/\sigma_x = 0.8 \cdot 6/2 = 2.4$
$b = 50 - 2.4 \cdot 10 = 50 - 24 = 26$
→ $y = 2.4x + 26$
דף נוסחאות מסכם 📋
הדפס את הדף הזה ותלה מעל השולחן!
סטטיסטיקה תיאורית
ממוצע$\bar{x} = \dfrac{\sum x_i}{n}$
שונות$\sigma^2 = \dfrac{\sum(x_i-\bar{x})^2}{n} = \overline{x^2} - \bar{x}^2$
סטיית תקן$\sigma = \sqrt{\sigma^2}$
ציון תקן$Z = \dfrac{x-\mu}{\sigma}$
הסתברות
משלים$P(\bar{A}) = 1 - P(A)$
איחוד$P(A \cup B) = P(A) + P(B) - P(A \cap B)$
חיתוך (ב"ת)$P(A \cap B) = P(A) \cdot P(B)$
מותנית$P(A|B) = \dfrac{P(A \cap B)}{P(B)}$
בייס$P(A|B) = \dfrac{P(B|A)P(A)}{P(B)}$
בינומית
$P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}$
$E(X)=np \quad \sigma=\sqrt{np(1-p)}$
נורמלית
$Z = \dfrac{X-\mu}{\sigma} \quad \bar{X}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$
רגרסיה ומתאם
מקדם מתאם$r = \dfrac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum(x_i-\bar{x})^2 \sum(y_i-\bar{y})^2}} = \dfrac{\text{Cov}(x,y)}{\sigma_x \sigma_y}$
שיפוע קו רגרסיה$a = \dfrac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2} = r \cdot \dfrac{\sigma_y}{\sigma_x}$
חיתוך$b = \bar{y} - a\bar{x}$ · הקו עובר דרך $(\bar{x},\bar{y})$
כללי אצבע:
• כלל 68-95-99.7 למרחקים סטנדרטיים
• "לפחות" → השתמש במשלים
• תמיד תקנן ל-Z לפני שימוש בטבלה
• בעץ הסתברות: תמיד לבדוק שסכום ההסתברויות = 1
תרגילי בגרות לדוגמה
3 שאלות בסגנון בגרות — עם פתרון מלא. כסה את הפתרון, פתור לבד, ואז בדוק.
תרגיל 1 — נורמלית
משקלי תפוחים מתפלגים נורמלית: $\mu=180$ גרם, $\sigma=20$ גרם.
א. מה ההסתברות שתפוח אקראי ישקול יותר מ-200 גרם?
ב. מה ההסתברות שתפוח ישקול בין 160 ל-210 גרם?
פתרון:
א
$Z = (200-180)/20 = 1$
$P(X>200) = 1-\Phi(1) = 1-0.8413 = \mathbf{0.1587}$
ב
$Z_1 = -1, Z_2 = 1.5$
$P = \Phi(1.5)-\Phi(-1) = 0.9332-0.1587 = \mathbf{0.7745}$
תרגיל 2 — בייס
במפעל 60% מהרכיבים ממכונה A, 40% מ-B. 3% מרכיבי A פגומים, 5% מרכיבי B.
א. מה ההסתברות שרכיב אקראי פגום?
ב. רכיב פגום — מה הסיכוי שממכונה B?
פתרון:
א
$P(\text{פגום}) = 0.6 \cdot 0.03 + 0.4 \cdot 0.05 = 0.018 + 0.020 = \mathbf{0.038}$
ב
$P(B|\text{פגום}) = (0.4 \cdot 0.05)/0.038 = 0.020/0.038 \approx \mathbf{0.5263}$
תרגיל 3 — בינומית
20% מהצרכנים מעדיפים מותג X. בוחרים 10 באקראי.
א. בדיוק 3 מעדיפים? · ב. לפחות 2 מעדיפים? · ג. תוחלת וסטיית תקן?
פתרון:
א
$P(X=3) = \binom{10}{3}(0.2)^3(0.8)^7 = 120 \cdot 0.008 \cdot 0.2097 \approx \mathbf{0.2013}$
ב
$P(X=0) = 0.8^{10} \approx 0.1074$
$P(X=1) = 10 \cdot 0.2 \cdot 0.8^9 \approx 0.2684$
$P(X \geq 2) = 1 - 0.1074 - 0.2684 = \mathbf{0.6242}$
ג
$E(X) = 10 \cdot 0.2 = \mathbf{2}$
$\sigma = \sqrt{10 \cdot 0.2 \cdot 0.8} = \sqrt{1.6} \approx \mathbf{1.265}$
🎓 בהצלחה בבגרות!
זכרו: סטטיסטיקה היא על הבנה — לא על שינון. אם הבנת את ה"למה" מאחורי כל נוסחה — הצלחת.
תרגילי בגרות — רגרסיה
4 שאלות בסגנון בגרות 4 יח"ל עם פתרונות מפורטים.
תרגיל 1 — חישוב r וקו הרגרסיה
חברה בדקה קשר בין מספר פרסומים בעיתון (x) למכירות באלפי ש"ח (y) במשך 6 שבועות:
(1, 20), (2, 30), (3, 35), (4, 45), (5, 55), (6, 65)
א. חשב את $\bar{x}, \bar{y}$.
ב. מצא את משוואת קו הרגרסיה y על x.
ג. חשב את מקדם המתאם r וקבע את עוצמת הקשר.
ד. חזה את המכירות עבור 7 פרסומים.
פתרון:
א
$\bar{x} = (1+2+3+4+5+6)/6 = 21/6 = 3.5$
$\bar{y} = (20+30+35+45+55+65)/6 = 250/6 \approx 41.67$
ב
חישוב: $\sum(x-\bar{x})^2 = 17.5$ , $\sum(x-\bar{x})(y-\bar{y}) = 152.5$
$a = 152.5/17.5 \approx \mathbf{8.71}$
$b = 41.67 - 8.71 \cdot 3.5 \approx 41.67 - 30.5 \approx \mathbf{11.17}$
→ $y = 8.71x + 11.17$
ג
$\sum(y-\bar{y})^2 \approx 1358.33$
$r = 152.5 / \sqrt{17.5 \cdot 1358.33} \approx 152.5/154.2 \approx \mathbf{0.989}$
→ קשר חיובי חזק מאד (כמעט מושלם).
ד
$y = 8.71 \cdot 7 + 11.17 = 60.97 + 11.17 \approx \mathbf{72.14}$ אלפי ש"ח
תרגיל 2 — שימוש בפרמטרים סטטיסטיים
במחקר על 50 תלמידים נמדדו שעות לימוד שבועיות (x) וציון שנתי (y). התקבלו הנתונים הבאים:
$\bar{x} = 15, \bar{y} = 80, \sigma_x = 4, \sigma_y = 10, r = 0.75$
א. מצא את שיפוע קו הרגרסיה y על x.
ב. מצא את משוואת קו הרגרסיה.
ג. חזה ציון של תלמיד שלמד 18 שעות.
פתרון:
א
$a = r \cdot \sigma_y/\sigma_x = 0.75 \cdot 10/4 = 0.75 \cdot 2.5 = \mathbf{1.875}$
ב
$b = \bar{y} - a\bar{x} = 80 - 1.875 \cdot 15 = 80 - 28.125 = \mathbf{51.875}$
→ $y = 1.875x + 51.875$
ג
$y = 1.875 \cdot 18 + 51.875 = 33.75 + 51.875 = \mathbf{85.625}$
תרגיל 3 — תכונות מקדם המתאם
חוקר בדק קשר בין משקל (x בק"ג) לגובה (y בס"מ) של 100 אנשים. קיבל $r = 0.65$.
א. מה משמעות המקדם? (עוצמה וכיוון)
ב. אם נוסיף 2 ס"מ לגובה של כל אדם — מה יהיה r החדש?
ג. אם נכפיל את כל המשקלים ב-2.2 (להמיר לפאונד) — מה יהיה r החדש?
ד. אם נהפוך את כיוון המשתנה ונחשב $-y$ במקום $y$ — מה יהיה r?
פתרון:
א
$r = 0.65$ → קשר לינארי חיובי (כש-x גדל, y גדל בממוצע) בעוצמה בינונית-חזקה.
ב
הוספת קבוע לא משפיעה על r. → r נשאר 0.65
ג
הכפלה בקבוע חיובי לא משפיעה על r. → r נשאר 0.65
ד
הכפלה בקבוע שלילי (-1) הופכת את הסימן. → r = -0.65
העוצמה זהה, רק הכיוון התהפך.
תרגיל 4 — שימוש בתכונת (x̄, ȳ)
במחקר נמצא שמשוואת קו הרגרסיה של y על x היא:
$y = 3x + 7$
ידוע שממוצע המשתנה x בדגימה הוא $\bar{x} = 8$ וסטיית התקן $\sigma_x = 2$. בנוסף, $r = 0.6$.
א. מצא את $\bar{y}$.
ב. מצא את $\sigma_y$.
ג. חזה את ערך y עבור $x = 10$.
פתרון:
א
הקו עובר דרך $(\bar{x}, \bar{y})$, לכן נציב:
$\bar{y} = 3 \cdot 8 + 7 = 24 + 7 = \mathbf{31}$
ב
מהנוסחה $a = r \cdot \sigma_y/\sigma_x$ נבודד את $\sigma_y$:
$\sigma_y = a \cdot \sigma_x / r = 3 \cdot 2 / 0.6 = 6/0.6 = \mathbf{10}$
ג
$y = 3 \cdot 10 + 7 = \mathbf{37}$
✨ טיפ זהב לבגרות
זכור את 3 המשוואות הקסומות של רגרסיה: $a = r\sigma_y/\sigma_x$ · $b = \bar{y}-a\bar{x}$ · הקו עובר דרך $(\bar{x},\bar{y})$.
עם שלוש אלה — תענה על כל שאלת רגרסיה בבגרות.