Phân biệt trung vị (median) phân vị (quartile) trung bình (mean); Một trong những khó khăn cơ bản nhất của những bạn bắt đầu nghiên cứu định lượng là sụ phân biệt khó khăn của các định nghĩa sau, như trung vị phân vị trung bình trong thống kê.
Phân biệt trung vị phân vị trung bình
Sự khác biệt trung bình trung vị
Sự khác biệt giữa Trung bình và Trung vị | |
---|---|
Trung vị | Trung bình |
Số học trung bình của một tập hợp số nhất định được gọi là Trung bình. | Phương pháp tách mẫu cao hơn với giá trị thấp hơn, thường từ phân phối xác suất được gọi là giá trị trung bình |
Ứng dụng cho giá trị trung bình là dành cho các bản phân phối bình thường | Ứng dụng chính cho trung vị là phân phối lệch. |
Có rất nhiều yếu tố bên ngoài hạn chế việc sử dụng Mean. | Nó mạnh mẽ và đáng tin cậy hơn nhiều để đo dữ liệu đối với dữ liệu không đồng đều. |
Giá trị trung bình có thể được tìm thấy bằng cách tính bằng cách cộng tất cả các giá trị và chia tổng cho số giá trị. | Số trung vị có thể được tìm thấy bằng cách liệt kê tất cả các số có sẵn trong tập hợp trong việc sắp xếp thứ tự và sau đó tìm số ở trung tâm của phân phối. |
Trung bình được coi là một trung bình số học. | Median được coi là một trung bình vị trí. |
Nó rất nhạy cảm với dữ liệu ngoại lệ | Nó không nhạy cảm nhiều với dữ liệu ngoại lai. |
Nó xác định giá trị trung tâm của tập dữ liệu. | Nó xác định trọng tâm của điểm giữa của tập dữ liệu. |
Thống kê là một nhánh của toán học liên quan đến các khái niệm về giá trị trung bình và số trung vị. Giá trị trung bình là giá trị trung bình của một số mục nhất định trong một tập dữ liệu , trong khi giá trị trung bình là giá trị trung bình nhất trong một tập dữ liệu nhất định. Trung bình, trung vị và chế độ là các thước đo của xu hướng trung tâm. Giá trị trung tâm đại diện cho tập hợp đầy đủ các giá trị có trong tập dữ liệu. Nó được tìm thấy bằng cách cộng tất cả các giá trị dữ liệu và chia chúng cho tổng số giá trị trong tập dữ liệu. Ví dụ: trung bình của năm số tự nhiên đầu tiên là (1 + 2 + 3 + 4 + 5) / 5 là 3. Trung vị của năm số tự nhiên đầu tiên cũng là 3, vì 3 là giá trị trung tâm trong dữ liệu bộ. Thước đo xu hướng trung tâm được lựa chọn phụ thuộc vào loại tập dữ liệu.
Trung bình là gì ?
Trung bình là tỷ lệ của tổng tất cả các giá trị trong tập dữ liệu với tổng số mục trong tập dữ liệu. Giá trị trung bình (trung bình) của một tập dữ liệu được tính bằng cách cộng tất cả các số và chia tổng cho số giá trị trong tập dữ liệu. Ví dụ, giá trị trung bình của ba số chẵn đầu tiên là (2 + 4 + 6) / 3, bằng 4. Loại giá trị trung bình thường được sử dụng và phổ biến nhất là trung bình cộng. Nó đại diện cho một giá trị điển hình của một tập dữ liệu. Các loại phương tiện khác là trung bình hình học, trung bình điều hòa và trung bình có trọng số. Nếu loại giá trị trung bình không được đề cập, thì chúng tôi lấy nó làm giá trị trung bình cộng.
Trung vị là gì ?
Như tên cho thấy, giá trị trung bình là giá trị ở giữa trong một tập dữ liệu nhất định. Trước khi tìm giá trị trung bình, tập dữ liệu được sắp xếp theo thứ tự tăng dần. Bây giờ giá trị ở giữa được coi là giá trị trung bình. Nếu tổng số mục trong danh sách là số lẻ, thì sau khi sắp xếp các phần tử theo thứ tự tăng dần, giá trị ở giữa được lấy làm giá trị trung vị. Nếu số mục trong tập dữ liệu là số chẵn, thì giá trị trung bình của hai giá trị giữa được lấy, nghĩa là, số hạng thứ [( n / 2) + (( n / 2) + 1) số hạng thứ ] / 2, trong đó ‘n’ là tổng số quan sát. Nếu có một số lẻ các mục trong tập dữ liệu, thì trung vị được cho bởi số hạng thứ [(n + 1) / 2] , trong đó ‘ n ‘ là tổng số quan sát.
Tại sao cần phải phân biệt trung bình trung vị
Đôi khi cần phải hiểu và diễn giải những gì một bộ dữ liệu nhất định được thu thập nói về điều gì. Trong tất cả các trường hợp, chúng tôi không thể sử dụng giá trị trung bình hoặc giá trị trung bình để tìm thước đo trung tâm hoặc giá trị thường đại diện cho một tập dữ liệu. Nếu danh sách dữ liệu chứa các giá trị cực cao và cực thấp, thì việc tìm giá trị trung bình sẽ không cung cấp một bức tranh rõ ràng về phần lớn các giá trị trong tập dữ liệu đại diện. Trong những trường hợp như vậy, giá trị trung vị hữu ích khi các giá trị được sắp xếp theo thứ tự tăng dần trước khi tìm ra giá trị trung tâm.Một thuật ngữ quan trọng được biết đến ở đây là ngoại lệ. Giá trị ngoại lai là các giá trị trong tập dữ liệu nằm hoàn toàn ngoài phạm vi của hầu hết các giá trị.
Ví dụ, trong tập dữ liệu sau: (2, 486, 490, 496, 998); 2 và 998 là các giá trị ngoại lệ vì chúng hoàn toàn nằm ngoài phạm vi của các giá trị khác. Trong khi tính giá trị trung bình và giá trị trung vị, điều rất quan trọng cần lưu ý là có bất kỳ giá trị ngoại lệ nào trong tập dữ liệu đã cho hay không, vì nó ảnh hưởng rất lớn đến các giá trị của giá trị trung bình và giá trị trung vị. Sự khác biệt chính giữa giá trị trung bình và giá trị trung bình được lập bảng bên dưới.
Phân vị là gì ?
Phân vị là một thuật ngữ thống kê mô tả việc phân chia các quan sát thành bốn khoảng xác định dựa trên các giá trị của dữ liệu và cách chúng so sánh với toàn bộ tập hợp các quan sát.
- Các phân vị dữ liệu thành ba điểm — phần tư thấp hơn, phần trung bình và phần tư phía trên — để tạo thành bốn nhóm của tập dữ liệu.
- Cùng với các giá trị tối thiểu và tối đa của tập dữ liệu, các phân vị chia một tập hợp các quan sát thành bốn phần, mỗi phần đại diện cho 25% các quan sát.
- phân vị được sử dụng để tính toán phạm vi giữa các phần tư, là thước đo sự biến thiên xung quanh trung vị.
Hiểu về phân vị
Để hiểu phần tư, điều quan trọng là phải hiểu trung vị là thước đo xu hướng trung tâm . Giá trị trung bình trong thống kê là giá trị giữa của một tập hợp số. Đây là điểm mà tại đó chính xác một nửa dữ liệu nằm bên dưới và bên trên giá trị trung tâm.
Vì vậy, với một bộ 13 số được sắp xếp (tăng dần hoặc giảm dần), trung vị sẽ là số thứ bảy. Sáu số đứng trước giá trị này là những số thấp nhất trong dữ liệu và sáu số sau giá trị trung vị là những số cao nhất trong tập dữ liệu đã cho. Vì giá trị trung bình không bị ảnh hưởng bởi các giá trị cực trị hoặc giá trị ngoại lệ trong phân phối, nên nó đôi khi được ưu tiên hơn giá trị trung bình .
Giá trị trung bình là một công cụ ước tính mạnh mẽ về vị trí nhưng không nói gì về cách dữ liệu ở hai bên giá trị của nó được lan truyền hoặc phân tán như thế nào. Đó là nơi mà phần tư bước vào. Phần tư đo lường sự lan truyền của các giá trị trên và dưới giá trị trung bình bằng cách chia phân phối thành bốn nhóm.
Cách các phần tư trung vị hoạt động
Giống như trung vị chia dữ liệu thành một nửa sao cho 50% phép đo nằm dưới trung vị và 50% nằm trên nó, phần tư chia dữ liệu thành các phần tư để 25% số đo nhỏ hơn phần tư thấp hơn, 50 % nhỏ hơn mức trung bình và 75% nhỏ hơn phần tư phía trên.
Có ba giá trị phần tư — một phần tư thấp hơn, trung vị và phần tư trên — để chia tập dữ liệu thành bốn phạm vi, mỗi phạm vi chứa 25% điểm dữ liệu. Phần tư thấp hơn, hoặc phần tư đầu tiên, được ký hiệu là Q1 và là số ở giữa nằm giữa giá trị nhỏ nhất của tập dữ liệu và giá trị trung bình. Phần tư thứ hai, Q2, cũng là trung vị. Phần tư trên hoặc phần tư thứ ba, được ký hiệu là Q3, là điểm trung tâm nằm giữa số trung vị và số cao nhất của phân phối.
Bây giờ, chúng ta có thể vạch ra bốn nhóm được hình thành từ các phần tư. Nhóm giá trị đầu tiên chứa số nhỏ nhất đến Q1; nhóm thứ hai bao gồm Q1 đến trung vị; tập thứ ba là trung vị đến Q3; danh mục thứ tư bao gồm Q3 đến điểm dữ liệu cao nhất của toàn bộ tập hợp.
Mỗi khoảng thời gian chứa 25% tổng số quan sát. Nói chung, dữ liệu được sắp xếp từ nhỏ nhất đến lớn nhất:
- Khoảng đầu tiên : Tập hợp các điểm dữ liệu giữa giá trị nhỏ nhất và phần tư đầu tiên.
- Khoảng thứ hai : Tập hợp các điểm dữ liệu giữa phần tư thấp hơn và trung vị.
- Khoảng thứ ba : Tập hợp dữ liệu giữa phần trung vị và phần tư trên.
- Khoảng thứ tư : Tập hợp các điểm dữ liệu giữa phần tư trên và giá trị lớn nhất của tập dữ liệu.
Pingback: Phân biệt trung vị (median) phân vị (quartile) trung bình (mean) - Phân tích kinh doanh chuyên nghiệp