Máy Tính Thống Kê
Độ lệch chuẩn


Độ lệch chuẩn

Với một tập dữ liệu rời rạc cho trước, máy tính sẽ tính toán giá trị trung bình, phương sai và độ lệch chuẩn của một mẫu hoặc một tổng thể và hiển thị tất cả các bước thực hiện của phép tính.

Kết Quả
Độ Lệch Chuẩn s = 4.5
Phương Sai s2 = 20.24
Số Lượng n = 7
Trung Bình x̄ = 14.29
Tổng Bình Phương SS = 100

Có lỗi với phép tính của bạn.

Mục lục

  1. Độ lệch chuẩn là một phép đo thống kê
  2. Các quy tắc khi sử dụng máy tính này
  3. Các vấn đề mà máy tính này có thể giải quyết
  4. Công thức tính độ lệch chuẩn
  5. Cách tính Độ lệch chuẩn
  6. Ví dụ tính độ lệch chuẩn của một mẫu
  7. Ứng dụng của độ lệch chuẩn

Độ lệch chuẩn

Độ lệch chuẩn là một phép đo thống kê

Độ lệch chuẩn là một trong những số liệu được sử dụng phổ biến nhất để mô tả số liệu thống kê của một tập dữ liệu nhất định. Độ lệch chuẩn, nói một cách đơn giản, là thước đo mức độ phân tán của một tập dữ liệu. Bằng cách tính độ lệch chuẩn, bạn có thể biết được các số đó gần hay xa giá trị trung bình. Nếu các điểm dữ liệu cách xa giá trị trung bình thì có nghĩa là có độ lệch lớn. Do đó, độ phân tán trong dữ liệu càng lớn thì độ lệch chuẩn càng cao.

Công cụ máy tính này giúp xác định độ lệch chuẩn của một tập dữ liệu nhất định và hiển thị các bước thực hiện liên quan đến phép tính.

Các quy tắc khi sử dụng máy tính này

Máy tính này chấp nhận đầu vào dưới dạng danh sách các số được phân tách nhau bằng dấu phân cách. Một vài ví dụ về đầu vào có thể được hiển thị trong bảng dưới đây.

đầu vào hàng đầu vào cột đầu vào cột đầu vào cột
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Các số có thể được phân tách bằng dấu phẩy/khoảng trắng/dấu xuống dòng hoặc sự kết hợp của chúng và có thể được chèn ở định dạng hàng hoặc cột. Đối với tất cả các định dạng được hiển thị ở bảng trên, máy tính xử lý dữ liệu đầu vào là 44, 63, 72, 75, 80, 86, 87 và 89.

Sau khi nhập dữ liệu, bạn hãy chọn liệu dữ liệu là mẫu hoặc tổng thể và nhấn Enter. Máy tính sẽ hiển thị năm tham số thống kê của tập dữ liệu: số lượng (số phần tử), giá trị trung bình, tổng bình phương chênh lệch, phương sai và độ lệch chuẩn.

Các vấn đề mà máy tính này có thể giải quyết

Công cụ máy tính này được thiết kế để tính toán độ lệch chuẩn của một tập dữ liệu rời rạc và đưa ra lời giải cụ thể sau quá trình tính toán.

Dữ liệu có thể bao gồm một tổng thể bao gồm tất cả các phần tử trong một thử nghiệm (bất kỳ loại nào) dưới các điều kiện nhất định. Trong nhiều trường hợp, việc lấy mẫu từng thành viên của tổng thể là không thể.

Trong thống kê, thường làm việc với một phần của một 'tổng thể' lớn hơn, mà chúng ta gọi là 'mẫu'. Điều này bởi vì thường không thực tế hoặc không thể thu thập dữ liệu từ mỗi cá nhân trong tổng thể. Chúng ta đưa ra ước lượng hoặc suy luận về tổng thể dựa trên thông tin thu thập từ mẫu.

Khi tính độ lệch chuẩn, công thức chúng ta sử dụng được tuỳ biến tùy thuộc vào việc chúng ta đang xử lý một mẫu hay toàn bộ tổng thể. Điều chỉnh này được thực hiện thông qua một yếu tố được gọi là 'độ tự do'. Đối với một mẫu, chúng ta chia cho n - 1 (trong đó n là kích thước mẫu) thay vì n khi tính phương sai, sau đó lấy bình phương để tìm ra độ lệch chuẩn. Sự điều chỉnh này bù lại cho việc chúng ta sử dụng dữ liệu mẫu để ước lượng độ lệch chuẩn của tổng thể và đảm bảo ước lượng của chúng ta là không thiên vị.

Độ lệch chuẩn đo lường sự phân tán/mức chênh lệch/độ biến động trung bình của một tập dữ liệu so với giá trị trung bình. Thường được biểu diễn bằng chữ cái Hy Lạp σ cho một quần thể hoặc s cho một mẫu. Một giá trị lớn của σ hoặc s ngụ ý sự phân tán lớn của các điểm dữ liệu từ giá trị trung bình của mẫu và ngược lại.

Hãy xem xét các ví dụ sau đây về các tập dữ liệu.

(Tập dữ liệu I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

( Tập dữ liệu II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20 Nhập các tập dữ liệu này vào máy tính, chúng ta có cho tập dữ liệu I:

  • x̄=16 - giá trị trung bình
  • s=8.3904708 - độ lệch chuẩn

Đối với tập dữ liệu II:

  • x̄=16 - giá trị trung bình
  • s=2,3664319 - độ lệch chuẩn

Trong Tập dữ liệu I, các số lệch lớn so với giá trị trung bình của mẫu (s=8,39), trong khi đó trong Tập dữ liệu II, biến động nhỏ hơn (s=2,36) so với Tập dữ liệu I.

Công thức tính độ lệch chuẩn

Công thức này được áp dụng khi tất cả các giá trị của tổng thể được phân tích.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ là độ lệch chuẩn của tổng thể,
  • xᵢ là giá trị của một phần tử cụ thể trong quần thể,
  • μ là trung bình cộng của tổng thể,
  • n là kích thước của tổng thể. Công thức dưới đây được sử dụng khi tổng thể có kích thước rất lớn và chỉ một mẫu của nó được lấy ra để phân tích..

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s là độ lệch chuẩn của mẫu,
  • xᵢ là giá trị của một giá trị mẫu cụ thể,
  • là trung bình của mẫu,
  • n là kích thước của mẫu.

Cách tính Độ lệch chuẩn

Các bước sau được thực hiện trong quá trình tính độ lệch chuẩn.

Bước 1: Tính giá trị trung bình cộng của mẫu/tổng thể. Đó là tổng của tất cả các điểm dữ liệu chia cho số lượng N hoặc n, tức là.

Trung bình cộng của mẫu:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

Trung bình cộng của tổng thể:

$$\mu=\frac{x₁+x₂+x₃+........+x_N}{N}$$

Bước 2: Tính các độ lệch bằng cách trừ mỗi điểm dữ liệu (phần tử) cho trung bình cộng của mẫu/tổng thể , tức là.

Các độ lệch của mẫu:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x})…………………… (x_n-\bar{x})$$

Các độ lệch của tổng thể:

$$(x₁-\ \mu), (x₂-\ \mu), (x₃-\ \mu)……………….. (x_N-\ \mu)$$

Bước 3: Tính toán bình phương độ lệch cho từng điểm dữ liệu (phần tử).

Bình phương độ lệch của mẫu:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2…………………… (x_n-\bar{x})^2$$

Bình phương độ lệch của tổng thể:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x₃-\ \mu)^2……………….. (x_N-\ \mu)^2$$

Bước 4: Tính tổng các bình phương độ lệch bằng cách cộng tất cả từng bình phương độ lệch

Tổng các bình phương độ lệch của mẫu:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

Tổng các bình phương độ lệch của tổng thể:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x₃-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

Bước 5: Chia tổng bình phương độ lệch cho số bậc tự do để có được phương sai. Đối với một tổng thể, chia cho N và đối với một mẫu, chia cho n-1.

Phương sai của mẫu

$$s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1}$$

Phương sai của tổng thể

$$\sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N}$$

Khi tính phương sai của một mẫu, chúng ta có thể giả định rằng chúng ta sẽ sử dụng biểu thức dưới đây cho các phép tính:

$$\frac{(x-\bar{x})^2}{n}$$

trong đó

x̄ là trung bình cộng của mẫu và n là kích thước mẫu. Nhưng một công thức như vậy không được sử dụng.

Một biểu thức như vậy sẽ không cho ra một ước lượng tốt về phương sai của tổng thể. Khi tổng thể tổng quát rất lớn và mẫu rất nhỏ, phương sai tính toán bằng công thức này sẽ đánh giá thấp phương sai của tổng thể. Điều này sẽ cho thấy phương sai quá nhỏ do thiếu dữ liệu. Vì vậy, bằng cách sử dụng biểu thức n-1, chúng ta tăng giá trị phương sai tiềm năng.

Thay vì chia cho n, chúng ta tính phương sai của mẫu bằng cách chia cho n-1. Việc này cho giá trị phương sai lớn hơn một chút, gần với giá trị thực tế hơn.

Bước 6: Rút căn bậc hai của số kết quả thu được. Độ lệch chuẩn là căn bậc hai của phương sai.

Độ lệch chuẩn của mẫu

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

Độ lệch chuẩn của tổng thể

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

Ví dụ tính độ lệch chuẩn của một mẫu

Chúng ta hãy xem xét điểm số sau đây của n=8 học sinh trong bài thi cuối kỳ môn Vật lý:

45, 67, 70, 75, 80, 81, 82 và 84

Máy tính tính độ lệch chuẩn của mẫu theo các bước sau:

Bước 1: Tính giá trị trung bình cộng.

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

Bước 2: Tính các mức chênh lệch

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Bước 3: Tính bình phương của các độ lệch (mức chênh lệch)

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Bước 4: Tính tổng tất cả các bình phương chênh lệch.

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

Bước 5: Tính phương sai bằng cách chia tổng bình phương độ lệch cho bậc tự do (n-1). Đối với một tổng thể, phương sai ở bước này sẽ được chia cho N thay vì N-1. Trong trường hợp này, chúng ta đang làm việc với một mẫu, tức là dữ liệu về một phần trong tổng thể học sinh, không phải toàn bộ tổng thể.

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

Bước 6: Lấy căn bậc hai của phương sai để thu được độ lệch chuẩn.

$$s=\sqrt{s^2}=\ \sqrt{164}=12,80$$

Ứng dụng của độ lệch chuẩn

Độ phân tán và độ lệch chuẩn có thể được sử dụng để xác định độ phân tán của dữ liệu. Nếu phương sai hoặc độ lệch chuẩn lớn thì dữ liệu sẽ bị phân tán nhiều hơn. Thông tin này rất hữu ích khi so sánh hai (hoặc nhiều) tập dữ liệu để xác định tập dữ liệu nào có nhiều biến số (nhiều nhất).

Trong các ngành công nghiệp, độ lệch chuẩn được sử dụng rộng rãi để kiểm soát chất lượng. Trong sản xuất quy mô lớn, một số đặc tính sản phẩm nhất định phải nằm trong phạm vi xác định cho phép bằng cách tính độ lệch chuẩn. Ví dụ, trong quá trình sản xuất đai ốc và bu lông, sự thay đổi đường kính của chúng phải nhỏ, nếu không các bộ phận sẽ không khớp với nhau.

Độ lệch chuẩn được sử dụng trong tài chính và nhiều lĩnh vực khác để đánh giá rủi ro. Trong phân tích kỹ thuật, độ lệch chuẩn được sử dụng để xây dựng đường Bollinger và tính toán mức độ biến động.

Ngoài ra, độ lệch chuẩn còn được sử dụng trong tài chính như một thước đo độ biến động. Và trong xã hội học, nó được sử dụng trong các cuộc thăm dò dư luận để giúp tính toán các yếu tố không chắc chắn.

Phương sai và độ lệch chuẩn được sử dụng để xác định số lượng giá trị dữ liệu nằm trong khoảng phân phối nhất định. Ví dụ, định lý Chebyshev cho thấy rằng đối với bất kỳ phân bố nào, ít nhất 75% giá trị dữ liệu sẽ nằm trong khoảng 2 độ lệch chuẩn so với giá trị trung bình.

Hãy lấy một ví dụ đơn giản với khí hậu. Giả sử chúng ta nghiên cứu nhiệt độ hàng ngày của hai thành phố trong cùng một khu vực. Một thành phố nằm trên bờ biển và thành phố kia nằm trong đất liền. Nhiệt độ trung bình tối đa hàng ngày ở hai thành phố này có thể giống nhau. Nhưng độ lệch chuẩn, tức là độ chênh lệch nhiệt độ tối đa hàng ngày sẽ lớn hơn đối với thành phố nằm trong đất liền và thành phố ven biển sẽ có độ lệch chuẩn nhiệt độ tối đa hàng ngày nhỏ hơn.

Điều này có nghĩa là một thành phố trong lục địa sẽ có sự thay đổi lớn hơn về nhiệt độ không khí tối đa vào bất kỳ ngày nào trong năm so với thành phố ven biển. Tức là thành phố ven biển sẽ có khí hậu ôn hòa hơn.