סטטיסטיקה
והסתברות

חוברת מדריך למתחילים
גם אם אף פעם לא הבנת — החוברת הזאת תיקח אותך מאפס
עד רמה של בגרות 4 יחידות לימוד
📊 8 פרקים ✏️ דוגמאות מפורטות 🎯 תרגילי בדיקה 📖 כיתה י"א

שלום!

החוברת הזאת נכתבה במיוחד בשבילך — התלמיד שמגיע לסטטיסטיקה ומרגיש שזה "סינית". אל דאגה. עד סוף החוברת תבין הכל.

איך להשתמש בחוברת:

מה נלמד בפנים?

  1. מדדי מרכז: ממוצע, חציון, שכיח
  2. פיזור: שונות וסטיית תקן
  3. ציון תקן (Z) — להשוות בין דברים שונים
  4. הסתברות: הבסיס
  5. הסתברות מותנית ועץ הסתברות
  6. התפלגות בינומית
  7. התפלגות נורמלית
  8. רגרסיה לינארית ומקדם מתאם
עוד לא נעזר במחשבון? עכשיו הזמן. מחשבון מדעי פשוט יספיק לכל מה שנלמד.

1ממוצע, חציון, שכיח

שלושה מדדי "מרכז" — שלוש דרכים לענות על השאלה: "איפה הנתונים נמצאים באמצע?"

1.1 ממוצע (Mean)

באת הביתה עם תעודה: 70, 80, 90, 85, 75, 100. אמא שואלת "איך אתה בכללי?" — אתה עונה: "בממוצע 83". איך חישבת? סכמת הכל וחילקת ב-6.
נוסחת הממוצע $\bar{x} = \dfrac{x_1 + x_2 + \ldots + x_n}{n} = \dfrac{\sum x_i}{n}$

פשוט: סכום כל הערכים חלקי כמות הערכים. זהו.

נתונים: 70, 80, 90, 85, 75, 100
סכום: 70+80+90+85+75+100 = 500
כמות: n = 6
ממוצע: 500 ÷ 6 ≈ 83.33

1.2 חציון (Median)

חמישה חברים עומדים בשורה לפי גובה. מי באמצע? — החציון.

איך מוצאים חציון?

1
ממיינים את הנתונים מהקטן לגדול.
2
אם n אי-זוגי — החציון הוא הערך באמצע.
3
אם n זוגי — החציון הוא ממוצע של שני הערכים האמצעיים.
נתונים: 70, 80, 90, 85, 75, 100
אחרי מיון: 70, 75, 80, 85, 90, 100
n=6 (זוגי) → שני אמצעיים הם 80 ו-85
חציון = (80+85)/2 = 82.5

1.3 שכיח (Mode)

הערך שמופיע הכי הרבה פעמים. פשוט.

נתונים: 3, 5, 5, 7, 8, 8, 8, 9
המספר 8 מופיע 3 פעמים — הכי הרבה.
שכיח = 8

1.4 מתי משתמשים במה?

מתי?במה להשתמש?
אין ערכים חריגים, נתונים רגיליםממוצע
יש ערכים חריגים מאד (למשל: 1, 2, 3, 4, 1000)חציון
נתונים לא מספריים (צבעים, סוגים)שכיח
ערכים חריגים מעוותים את הממוצע! לדוגמה, אם במשרד 10 אנשים מרוויחים 10,000 ש"ח והמנכ"ל מרוויח 200,000 — הממוצע יקפוץ ל-27,000, אבל החציון יישאר 10,000. לכן לעיתים חציון "מספר יותר אמת".

1.5 ממוצע משוקלל

כשלכל ערך יש "משקל" שונה (כמה פעמים הוא מופיע):

ממוצע משוקלל $\bar{x} = \dfrac{\sum f_i x_i}{\sum f_i}$

כאן $f_i$ = השכיחות (משקל) של הערך $x_i$.

ציונים בכיתה:
ציון 70 — 5 תלמידים
ציון 80 — 10 תלמידים
ציון 90 — 5 תלמידים
ממוצע = (70·5 + 80·10 + 90·5) / (5+10+5) = 1600 / 20 = 80

נתונים: 4, 6, 6, 8, 10, 10, 10, 12. מצא ממוצע, חציון ושכיח.

ממוצע = (4+6+6+8+10+10+10+12)/8 = 66/8 = 8.25 · חציון = (8+10)/2 = 9 · שכיח = 10

2שונות וסטיית תקן

איך מודדים עד כמה הנתונים "מפוזרים"?

2.1 הבעיה: ממוצע זה לא מספיק

שתי כיתות עשו מבחן. שתיהן קיבלו ממוצע 80. האם הכיתות זהות?

כיתה א': 75, 78, 80, 82, 85 — כולם קרובים ל-80.
כיתה ב': 40, 60, 80, 100, 120 — פיזור ענק!

שני ממוצעים זהים — אבל פיזור הפוך לחלוטין.

סטיית תקן מודדת כמה הנתונים מפוזרים סביב הממוצע. קטנה = מרוכזים, גדולה = פזורים.

2.2 איך מחשבים? (הנוסחה הבסיסית)

שונות $\sigma^2 = \dfrac{\sum (x_i - \bar{x})^2}{n}$
סטיית תקן $\sigma = \sqrt{\sigma^2}$

הסבר צעד-צעד:

1
חישוב הממוצע $\bar{x}$.
2
לכל ערך מחשבים את ההפרש מהממוצע: $(x_i - \bar{x})$.
3
מעלים בריבוע (כדי שההפרשים השליליים לא יבטלו את החיוביים).
4
ממוצע של הריבועים — זו השונות $\sigma^2$.
5
שורש → סטיית תקן $\sigma$.
נתונים: 2, 4, 4, 4, 5, 5, 7, 9
ממוצע: (2+4+4+4+5+5+7+9)/8 = 40/8 = 5

הפרשים בריבוע:
(2-5)² = 9, (4-5)² = 1 (×3), (4-5)² , (5-5)²=0 (×2), (7-5)²=4, (9-5)²=16
סכום: 9 + 1+1+1 + 0+0 + 4 + 16 = 32

שונות: 32/8 = 4
סטיית תקן: √4 = 2

2.3 נוסחה שימושית (חוסכת עבודה)

נוסחה חלופית לשונות $\sigma^2 = \overline{x^2} - \bar{x}^2$

כלומר: ממוצע הריבועים פחות ריבוע הממוצע.

הנוסחה הזו הרבה יותר מהירה — במקום לחשב הפרשים, פשוט מחשבים ממוצע הריבועים וריבוע הממוצע.
על אותם נתונים: 2, 4, 4, 4, 5, 5, 7, 9
ריבועים: 4, 16, 16, 16, 25, 25, 49, 81
ממוצע הריבועים: 232/8 = 29
ריבוע הממוצע: 5² = 25
שונות: 29 - 25 = 4 ✓ (זהה לתשובה הקודמת!)

2.4 תכונות חשובות (חוקי תקנון)

אם מוסיפים קבוע $c$ לכל ערך:
• הממוצע גדל ב-$c$
סטיית התקן לא משתנה
אם מכפילים כל ערך ב-קבוע $a$:
• הממוצע מוכפל ב-$a$
• סטיית התקן מוכפלת ב-$|a|$

ממוצע הציונים בכיתה הוא 70 וסטיית התקן 8. המורה מחליט להוסיף 5 נקודות לכל תלמיד. מה הממוצע והסטייה החדשים?

ממוצע חדש: 70+5 = 75 · סטיית תקן: נשארת 8 (קבוע לא משפיע על פיזור)

3ציון תקן (Z-score)

איך להשוות בין "תפוחים לתפוזים".

3.1 הבעיה

קיבלת 85 במבחן מתמטיקה ו-75 במבחן אנגלית. באיזה מבחן הצלחת יותר?

לא מספיק להסתכל על הציונים — צריך לדעת איך המבחנים ביחס לכיתה.

3.2 הפתרון: ציון תקן

ציון תקן ($Z$) אומר כמה סטיות תקן הערך שלך רחוק מהממוצע.

ציון תקן $Z = \dfrac{x - \mu}{\sigma}$
מתמטיקה: ציון 85, ממוצע כיתה 80, סטיית תקן 5
$Z_{\text{מתמטיקה}} = (85-80)/5 = 1$
→ סטיית תקן אחת מעל הממוצע.

אנגלית: ציון 75, ממוצע כיתה 65, סטיית תקן 5
$Z_{\text{אנגלית}} = (75-65)/5 = 2$
→ סטיית תקן שתיים מעל הממוצע.

מסקנה: באנגלית הצלחת יותר ביחס לכיתה! ✨

3.3 למה זה כל כך חשוב?

ציון תקן יופיע בכל שאלה על התפלגות נורמלית בבגרות. ממירים את הערכים ל-Z, ואז משתמשים בטבלת $Z$ כדי לדעת הסתברויות. נראה בפרק 7.

גובהי תלמידים בכיתה: ממוצע 168 ס"מ, סטיית תקן 6 ס"מ. דני גבוה 180. מה ציון התקן שלו?

Z = (180-168)/6 = 12/6 = 2 — דני נמצא 2 סטיות תקן מעל הממוצע

4הסתברות — הבסיס

מה הסיכוי שמשהו יקרה? כל הכללים שצריך.

4.1 הגדרה

זורקים מטבע. יש 2 תוצאות אפשריות (עץ/פלי). התוצאה "עץ" היא 1 מתוך 2.
ההסתברות ל-"עץ" = 1/2 = 0.5 = 50%.
הסתברות קלאסית $P(A) = \dfrac{\text{מספר תוצאות רצויות}}{\text{סך כל התוצאות}}$

4.2 משלים

המשלים של $A$ (מסומן $\bar{A}$) = כל מה שלא $A$.

$P(\bar{A}) = 1 - P(A)$
זורקים קובייה — מה ההסתברות לא לקבל 6?
$P(6) = 1/6$ → $P(\text{לא } 6) = 1 - 1/6 = 5/6$

4.3 איחוד — "או"

$P(A \cup B)$ = ההסתברות ש-A או B (או שניהם) יקרו.

$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

אם $A$ ו-$B$ זרים (לא יכולים לקרות ביחד): $P(A \cup B) = P(A) + P(B)$.

קובייה — מה ההסתברות לקבל 2 או 5?
הם זרים → $P = 1/6 + 1/6 = 2/6 = 1/3$

4.4 חיתוך — "גם וגם"

$P(A \cap B)$ = ההסתברות ש-A וגם B יקרו.

אם $A$ ו-$B$ בלתי תלויים:
$P(A \cap B) = P(A) \cdot P(B)$

בלתי תלויים = A לא משפיע על B. לדוגמה: שתי זריקות של מטבע.
זה לא אותו דבר כמו "זרים"!
זורקים 2 מטבעות — מה ההסתברות ששניהם עץ?
$P = (1/2) \cdot (1/2) = 1/4$

זורקים קובייה. מה ההסתברות לקבל מספר זוגי או גדול מ-4?

זוגי = {2,4,6} → 3/6. גדול מ-4 = {5,6} → 2/6. חיתוך (זוגי וגם >4) = {6} → 1/6.
איחוד = 3/6 + 2/6 − 1/6 = 4/6 = 2/3

5הסתברות מותנית ועץ הסתברות

מה ההסתברות ל-A בהינתן שB כבר קרה?

5.1 המושג

בקופסה 10 כדורים: 6 אדומים, 4 כחולים. הוצאת כדור אדום ולא החזרת.
בהינתן שהוצאת אדום — מה הסיכוי שהכדור הבא יהיה אדום?
עכשיו נשארו 9 כדורים, 5 אדומים. לכן: 5/9.
הסתברות מותנית $P(A|B) = \dfrac{P(A \cap B)}{P(B)}$

קוראים: "ההסתברות ל-A בהינתן B".

5.2 כלל הכפל

$P(A \cap B) = P(B) \cdot P(A|B)$

כלומר: A וגם B = B קודם, ואז A בהינתן B.

5.3 עץ הסתברות

הטכניקה הכי חשובה בפרק הזה! מציירים עץ, כל ענף = שלב. ההסתברות בסוף ענף = מכפלת כל ההסתברויות בדרך.

דוגמה: בקופסה 3 כדורים אדומים, 2 כחולים. מוציאים 2 כדורים, אחד אחרי השני, בלי החזרה.

עץ:
• אדום ראשון: 3/5 · אדום שני בהינתן אדום: 2/4 → 3/5 · 2/4 = 6/20
• אדום ראשון: 3/5 · כחול שני בהינתן אדום: 2/4 → 3/5 · 2/4 = 6/20
• כחול ראשון: 2/5 · אדום שני בהינתן כחול: 3/4 → 2/5 · 3/4 = 6/20
• כחול ראשון: 2/5 · כחול שני בהינתן כחול: 1/4 → 2/5 · 1/4 = 2/20

סה"כ: 6+6+6+2 = 20/20 = 1 ✓ (תמיד לבדוק!)

5.4 נוסחת ההסתברות השלמה

אם אנחנו יודעים את ההסתברויות בהינתן כל "ענף":

$P(B) = P(B|A) \cdot P(A) + P(B|\bar{A}) \cdot P(\bar{A})$

5.5 נוסחת בייס

הופכת את הכיוון: ממסקנה לסיבה.

$P(A|B) = \dfrac{P(B|A) \cdot P(A)}{P(B)}$
בדיקה רפואית: 1% מהאוכלוסייה חולה. הבדיקה מזהה נכון 95% מהחולים, ומטעה (חיובי כוזב) ב-5% מהבריאים.
אדם קיבל תוצאה חיובית — מה הסיכוי שהוא באמת חולה?

$P(B) = 0.95 \cdot 0.01 + 0.05 \cdot 0.99 = 0.0095 + 0.0495 = 0.059$
$P(\text{חולה}|B) = (0.95 \cdot 0.01)/0.059 \approx 0.161$
רק 16%! מפתיע — אבל הגיוני: יש הרבה יותר בריאים, אז גם 5% מהם גדול ממספר החולים הנכון.

בקופסה 4 כדורים לבנים ו-6 שחורים. מוציאים 2 ללא החזרה. מה ההסתברות ששניהם שחורים?

$P = (6/10) \cdot (5/9) = 30/90 = $ 1/3

6התפלגות בינומית

כמה "הצלחות" יהיו כשחוזרים על אותו ניסוי כמה פעמים?

6.1 מתי משתמשים?

כאשר יש לנו ניסוי שעונה על 4 תנאים:

  1. $n$ ניסויים בלתי תלויים
  2. כל ניסוי יש לו בדיוק 2 תוצאות אפשריות (הצלחה/כשלון)
  3. הסתברות ההצלחה קבועה בכל ניסוי — $p$
  4. סופרים כמה הצלחות סה"כ — $X$
דוגמה קלאסית: זריקת מטבע 10 פעמים — כמה "עצים" יצאו?
$n=10$, $p=0.5$ (הסתברות עץ), $X$ = מספר עצים.

6.2 הנוסחה

הסתברות בדיוק ל-k הצלחות מתוך n $P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$

מה זה $\binom{n}{k}$?

"n מעל k" — כמה דרכים לבחור $k$ הצלחות מתוך $n$ ניסויים.

$\binom{n}{k} = \dfrac{n!}{k!(n-k)!}$

תזכורת: $n! = n \cdot (n-1) \cdot (n-2) \cdot \ldots \cdot 1$. למשל $5! = 120$.

זורקים מטבע 5 פעמים. מה הסיכוי לבדיוק 3 עצים?
$n=5, k=3, p=0.5$
$\binom{5}{3} = 10$
$P = 10 \cdot 0.5^3 \cdot 0.5^2 = 10 \cdot 0.125 \cdot 0.25 = \mathbf{0.3125}$

6.3 תוחלת וסטיית תקן

מה המספר הממוצע של הצלחות? מה הפיזור?

תוחלת $E(X) = np$
שונות $V(X) = np(1-p)$
סטיית תקן $\sigma = \sqrt{np(1-p)}$
100 זריקות מטבע: $E(X) = 100 \cdot 0.5 = 50$ עצים בממוצע.
$\sigma = \sqrt{100 \cdot 0.5 \cdot 0.5} = \sqrt{25} = 5$.

6.4 "לפחות" / "לכל היותר" — טיפ חשוב

"לפחות 2 הצלחות":
$P(X \geq 2) = 1 - P(X=0) - P(X=1)$

קל יותר לחשב את המשלים ולהחסיר!

זורקים קובייה 4 פעמים. מה ההסתברות לקבל בדיוק 2 פעמים "6"?

$n=4, k=2, p=1/6$
$P = \binom{4}{2}(1/6)^2(5/6)^2 = 6 \cdot (1/36) \cdot (25/36) = 150/1296 \approx$ 0.1157

7התפלגות נורמלית

"הפעמון" — ההתפלגות החשובה ביותר בטבע.

7.1 מה זה?

גבהים של אנשים, ציונים בבגרות, משקלי תפוחים — הרבה מאוד דברים בטבע מתפלגים לפי עקומת פעמון:
סביב הממוצע יש הרבה, רחוק מהממוצע יש מעט.

כל התפלגות נורמלית מתוארת ב-2 פרמטרים:

כותבים: $X \sim N(\mu, \sigma^2)$.

7.2 כלל 68-95-99.7

כ-68% מהנתונים בטווח $\mu \pm \sigma$ (סטייה אחת)
כ-95% בטווח $\mu \pm 2\sigma$
כ-99.7% בטווח $\mu \pm 3\sigma$

7.3 התפלגות נורמלית תקנית

ההתפלגות שכולם מודדים לפיה: $\mu=0, \sigma=1$. מסמנים $Z$.

תמיד ממירים את ה-X ל-Z לפני החישוב:

$Z = \dfrac{X - \mu}{\sigma}$

7.4 איך קוראים טבלת Z

הטבלה נותנת $\Phi(z) = P(Z \leq z)$ — ההסתברות ש-Z קטן או שווה ל-$z$.

כללים שימושיים:

גובהי תלמידות בכיתה ט': $\mu=160$ ס"מ, $\sigma=5$ ס"מ.
מה ההסתברות שגובהה של תלמידה אקראית יהיה בין 155 ל-170?

המרה ל-Z:
$Z_1 = (155-160)/5 = -1$
$Z_2 = (170-160)/5 = 2$

מהטבלה:
$\Phi(2) = 0.9772$
$\Phi(-1) = 1 - \Phi(1) = 1 - 0.8413 = 0.1587$

$P = 0.9772 - 0.1587 = \mathbf{0.8185}$ (כ-82%)

7.5 דגימה — ממוצע של מדגם

אם לוקחים מדגם בגודל $n$ מאוכלוסייה עם $\mu, \sigma$ — גם ממוצע המדגם $\bar{X}$ מתפלג נורמלית:

$\bar{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right)$
$X \sim N(100, 10^2)$. מה ההסתברות שממוצע של 25 תצפיות יהיה מעל 103?

$\sigma_{\bar{X}} = 10/\sqrt{25} = 2$
$Z = (103-100)/2 = 1.5$
$P = 1 - \Phi(1.5) = 1 - 0.9332 = \mathbf{0.0668}$

$X \sim N(50, 4^2)$. מה $P(X > 58)$?

$Z = (58-50)/4 = 2$. $P(Z>2) = 1 - 0.9772 = $ 0.0228

8רגרסיה לינארית ומקדם מתאם

מציאת קו ישר שיתאר את הקשר בין שני משתנים — וחיזוי ערכים חדשים.

8.1 מה זה רגרסיה?

אספת נתונים של תלמידים: כמה שעות למדו למבחן (x) והציון שקיבלו (y).
מתקבלת שאלה: האם יש קשר? ואם כן — אם דני ילמד 4.5 שעות, איזה ציון צפוי לו?

רגרסיה לינארית עונה לשתי השאלות: היא מוצאת את הקו הישר $y = ax + b$ שהכי מתאר את הנתונים.

למה שימושי?

8.2 דיאגרמת פיזור (Scatter Plot)

לפני הכל — מציירים. כל נקודה היא תצפית אחת $(x_i, y_i)$. מסתכלים על "הצורה":

8.3 מקדם המתאם (r)

זה המספר שמודד את חוזק וכיוון הקשר הלינארי.

מקדם המתאם $r = \dfrac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \cdot \sum (y_i - \bar{y})^2}}$

או בנוסחה שקולה (עם שונות משותפת $\text{Cov}$):

$r = \dfrac{\text{Cov}(x,y)}{\sigma_x \cdot \sigma_y}$ ,   $\text{Cov}(x,y) = \overline{xy} - \bar{x}\cdot\bar{y}$

איך קוראים את r?

ערך rמשמעות
r = 1קשר חיובי מושלם — כל הנקודות על קו עולה
r = -1קשר שלילי מושלם — כל הנקודות על קו יורד
r = 0אין קשר לינארי
|r| > 0.7קשר חזק
0.3 < |r| < 0.7קשר בינוני
|r| < 0.3קשר חלש
r תמיד בטווח [-1, 1]. אם חישבת וקיבלת 1.5 — יש טעות!

8.4 תכונות חשובות של r

r לא משתנה אם:
• מוסיפים קבוע לכל ה-x או לכל ה-y
• מכפילים את כל ה-x (או y) בקבוע חיובי

r מחליף סימן אם מכפילים ב-קבוע שלילי.

8.5 קו הרגרסיה y על x

הקו הישר $y = ax + b$ שממזער את סכום ריבועי ההפרשים מהנקודות (שיטת הריבועים הפחותים).

שיפוע (slope) $a = \dfrac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2} = r \cdot \dfrac{\sigma_y}{\sigma_x}$
חיתוך עם ציר y $b = \bar{y} - a \cdot \bar{x}$
תכונה קריטית: קו הרגרסיה תמיד עובר דרך הנקודה $(\bar{x}, \bar{y})$.
אם יש לך את המשוואה ואת $\bar{x}$ — אפשר לחלץ את $\bar{y}$ בלי חישוב נוסף!

8.6 דוגמה מלאה — חישוב מ-א' עד ת'

נתונים: 5 תלמידים — שעות לימוד (x) וציון (y):
(2, 60), (3, 70), (4, 75), (5, 85), (6, 90)

שלב 1 — ממוצעים:
$\bar{x} = (2+3+4+5+6)/5 = 4$
$\bar{y} = (60+70+75+85+90)/5 = 76$

שלב 2 — טבלת עזר:
xy$x-\bar{x}$$y-\bar{y}$$(x-\bar{x})(y-\bar{y})$$(x-\bar{x})^2$$(y-\bar{y})^2$
260-2-16324256
370-1-66136
4750-1001
585199181
690214284196
סה"כ7510570
שלב 3 — שיפוע:
$a = 75/10 = \mathbf{7.5}$

שלב 4 — חיתוך:
$b = 76 - 7.5 \cdot 4 = 76 - 30 = \mathbf{46}$

משוואת קו הרגרסיה:
$\boxed{y = 7.5x + 46}$

שלב 5 — מקדם המתאם:
$r = 75 / \sqrt{10 \cdot 570} = 75 / \sqrt{5700} \approx 75/75.5 \approx \mathbf{0.993}$
→ קשר חיובי חזק מאד. כמעט מושלם!

שלב 6 — חיזוי: תלמיד למד 4.5 שעות:
$y = 7.5 \cdot 4.5 + 46 = 33.75 + 46 = \mathbf{79.75}$

8.7 חיזוי — מתי זה אמין?

חיזוי אמין רק בטווח הנתונים שיש לך.
בדוגמה: הנתונים היו 2-6 שעות. חיזוי ל-3 שעות? אמין. חיזוי ל-20 שעות? לא אמין (מחוץ לטווח).

נתון: $\bar{x}=10, \bar{y}=50, \sigma_x=2, \sigma_y=6, r=0.8$. מה משוואת קו הרגרסיה y על x?

$a = r \cdot \sigma_y/\sigma_x = 0.8 \cdot 6/2 = 2.4$
$b = 50 - 2.4 \cdot 10 = 50 - 24 = 26$
$y = 2.4x + 26$

דף נוסחאות מסכם 📋

הדפס את הדף הזה ותלה מעל השולחן!

סטטיסטיקה תיאורית

ממוצע$\bar{x} = \dfrac{\sum x_i}{n}$
שונות$\sigma^2 = \dfrac{\sum(x_i-\bar{x})^2}{n} = \overline{x^2} - \bar{x}^2$
סטיית תקן$\sigma = \sqrt{\sigma^2}$
ציון תקן$Z = \dfrac{x-\mu}{\sigma}$

הסתברות

משלים$P(\bar{A}) = 1 - P(A)$
איחוד$P(A \cup B) = P(A) + P(B) - P(A \cap B)$
חיתוך (ב"ת)$P(A \cap B) = P(A) \cdot P(B)$
מותנית$P(A|B) = \dfrac{P(A \cap B)}{P(B)}$
בייס$P(A|B) = \dfrac{P(B|A)P(A)}{P(B)}$

בינומית

$P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}$
$E(X)=np \quad \sigma=\sqrt{np(1-p)}$

נורמלית

$Z = \dfrac{X-\mu}{\sigma} \quad \bar{X}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$

רגרסיה ומתאם

מקדם מתאם$r = \dfrac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum(x_i-\bar{x})^2 \sum(y_i-\bar{y})^2}} = \dfrac{\text{Cov}(x,y)}{\sigma_x \sigma_y}$
שיפוע קו רגרסיה$a = \dfrac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2} = r \cdot \dfrac{\sigma_y}{\sigma_x}$
חיתוך$b = \bar{y} - a\bar{x}$  ·  הקו עובר דרך $(\bar{x},\bar{y})$
כללי אצבע:
• כלל 68-95-99.7 למרחקים סטנדרטיים
• "לפחות" → השתמש במשלים
• תמיד תקנן ל-Z לפני שימוש בטבלה
• בעץ הסתברות: תמיד לבדוק שסכום ההסתברויות = 1

תרגילי בגרות לדוגמה

3 שאלות בסגנון בגרות — עם פתרון מלא. כסה את הפתרון, פתור לבד, ואז בדוק.

תרגיל 1 — נורמלית

משקלי תפוחים מתפלגים נורמלית: $\mu=180$ גרם, $\sigma=20$ גרם.
א. מה ההסתברות שתפוח אקראי ישקול יותר מ-200 גרם?
ב. מה ההסתברות שתפוח ישקול בין 160 ל-210 גרם?

פתרון:

א
$Z = (200-180)/20 = 1$
$P(X>200) = 1-\Phi(1) = 1-0.8413 = \mathbf{0.1587}$
ב
$Z_1 = -1, Z_2 = 1.5$
$P = \Phi(1.5)-\Phi(-1) = 0.9332-0.1587 = \mathbf{0.7745}$

תרגיל 2 — בייס

במפעל 60% מהרכיבים ממכונה A, 40% מ-B. 3% מרכיבי A פגומים, 5% מרכיבי B.
א. מה ההסתברות שרכיב אקראי פגום?
ב. רכיב פגום — מה הסיכוי שממכונה B?

פתרון:

א
$P(\text{פגום}) = 0.6 \cdot 0.03 + 0.4 \cdot 0.05 = 0.018 + 0.020 = \mathbf{0.038}$
ב
$P(B|\text{פגום}) = (0.4 \cdot 0.05)/0.038 = 0.020/0.038 \approx \mathbf{0.5263}$

תרגיל 3 — בינומית

20% מהצרכנים מעדיפים מותג X. בוחרים 10 באקראי.
א. בדיוק 3 מעדיפים? · ב. לפחות 2 מעדיפים? · ג. תוחלת וסטיית תקן?

פתרון:

א
$P(X=3) = \binom{10}{3}(0.2)^3(0.8)^7 = 120 \cdot 0.008 \cdot 0.2097 \approx \mathbf{0.2013}$
ב
$P(X=0) = 0.8^{10} \approx 0.1074$
$P(X=1) = 10 \cdot 0.2 \cdot 0.8^9 \approx 0.2684$
$P(X \geq 2) = 1 - 0.1074 - 0.2684 = \mathbf{0.6242}$
ג
$E(X) = 10 \cdot 0.2 = \mathbf{2}$
$\sigma = \sqrt{10 \cdot 0.2 \cdot 0.8} = \sqrt{1.6} \approx \mathbf{1.265}$
🎓 בהצלחה בבגרות!
זכרו: סטטיסטיקה היא על הבנה — לא על שינון. אם הבנת את ה"למה" מאחורי כל נוסחה — הצלחת.

תרגילי בגרות — רגרסיה

4 שאלות בסגנון בגרות 4 יח"ל עם פתרונות מפורטים.

תרגיל 1 — חישוב r וקו הרגרסיה

חברה בדקה קשר בין מספר פרסומים בעיתון (x) למכירות באלפי ש"ח (y) במשך 6 שבועות:
(1, 20), (2, 30), (3, 35), (4, 45), (5, 55), (6, 65)

א. חשב את $\bar{x}, \bar{y}$.
ב. מצא את משוואת קו הרגרסיה y על x.
ג. חשב את מקדם המתאם r וקבע את עוצמת הקשר.
ד. חזה את המכירות עבור 7 פרסומים.

פתרון:

א
$\bar{x} = (1+2+3+4+5+6)/6 = 21/6 = 3.5$
$\bar{y} = (20+30+35+45+55+65)/6 = 250/6 \approx 41.67$
ב
חישוב: $\sum(x-\bar{x})^2 = 17.5$ , $\sum(x-\bar{x})(y-\bar{y}) = 152.5$
$a = 152.5/17.5 \approx \mathbf{8.71}$
$b = 41.67 - 8.71 \cdot 3.5 \approx 41.67 - 30.5 \approx \mathbf{11.17}$
$y = 8.71x + 11.17$
ג
$\sum(y-\bar{y})^2 \approx 1358.33$
$r = 152.5 / \sqrt{17.5 \cdot 1358.33} \approx 152.5/154.2 \approx \mathbf{0.989}$
→ קשר חיובי חזק מאד (כמעט מושלם).
ד
$y = 8.71 \cdot 7 + 11.17 = 60.97 + 11.17 \approx \mathbf{72.14}$ אלפי ש"ח

תרגיל 2 — שימוש בפרמטרים סטטיסטיים

במחקר על 50 תלמידים נמדדו שעות לימוד שבועיות (x) וציון שנתי (y). התקבלו הנתונים הבאים:
$\bar{x} = 15, \bar{y} = 80, \sigma_x = 4, \sigma_y = 10, r = 0.75$

א. מצא את שיפוע קו הרגרסיה y על x.
ב. מצא את משוואת קו הרגרסיה.
ג. חזה ציון של תלמיד שלמד 18 שעות.

פתרון:

א
$a = r \cdot \sigma_y/\sigma_x = 0.75 \cdot 10/4 = 0.75 \cdot 2.5 = \mathbf{1.875}$
ב
$b = \bar{y} - a\bar{x} = 80 - 1.875 \cdot 15 = 80 - 28.125 = \mathbf{51.875}$
$y = 1.875x + 51.875$
ג
$y = 1.875 \cdot 18 + 51.875 = 33.75 + 51.875 = \mathbf{85.625}$

תרגיל 3 — תכונות מקדם המתאם

חוקר בדק קשר בין משקל (x בק"ג) לגובה (y בס"מ) של 100 אנשים. קיבל $r = 0.65$.

א. מה משמעות המקדם? (עוצמה וכיוון)
ב. אם נוסיף 2 ס"מ לגובה של כל אדם — מה יהיה r החדש?
ג. אם נכפיל את כל המשקלים ב-2.2 (להמיר לפאונד) — מה יהיה r החדש?
ד. אם נהפוך את כיוון המשתנה ונחשב $-y$ במקום $y$ — מה יהיה r?

פתרון:

א
$r = 0.65$ → קשר לינארי חיובי (כש-x גדל, y גדל בממוצע) בעוצמה בינונית-חזקה.
ב
הוספת קבוע לא משפיעה על r. → r נשאר 0.65
ג
הכפלה בקבוע חיובי לא משפיעה על r. → r נשאר 0.65
ד
הכפלה בקבוע שלילי (-1) הופכת את הסימן. → r = -0.65
העוצמה זהה, רק הכיוון התהפך.

תרגיל 4 — שימוש בתכונת (x̄, ȳ)

במחקר נמצא שמשוואת קו הרגרסיה של y על x היא:
$y = 3x + 7$
ידוע שממוצע המשתנה x בדגימה הוא $\bar{x} = 8$ וסטיית התקן $\sigma_x = 2$. בנוסף, $r = 0.6$.

א. מצא את $\bar{y}$.
ב. מצא את $\sigma_y$.
ג. חזה את ערך y עבור $x = 10$.

פתרון:

א
הקו עובר דרך $(\bar{x}, \bar{y})$, לכן נציב:
$\bar{y} = 3 \cdot 8 + 7 = 24 + 7 = \mathbf{31}$
ב
מהנוסחה $a = r \cdot \sigma_y/\sigma_x$ נבודד את $\sigma_y$:
$\sigma_y = a \cdot \sigma_x / r = 3 \cdot 2 / 0.6 = 6/0.6 = \mathbf{10}$
ג
$y = 3 \cdot 10 + 7 = \mathbf{37}$
✨ טיפ זהב לבגרות
זכור את 3 המשוואות הקסומות של רגרסיה: $a = r\sigma_y/\sigma_x$ · $b = \bar{y}-a\bar{x}$ · הקו עובר דרך $(\bar{x},\bar{y})$.
עם שלוש אלה — תענה על כל שאלת רגרסיה בבגרות.