Biểu đồ phổ tần đáp tuyến (Frequency response graph) - Một công cụ mà trang review này sử dụng khá nhiều. Và không chỉ ở đây, mà cả cộng đồng Audio di động quốc tế cũng nhắc đến thứ này. Nhưng, đó là cái gì vậy?

Là những dòng ngoằn nghèo trên khung? Là nỗi sợ của các nhà sản xuất? Tư liệu của một vài thằng tự thẩm đi giả lập lại trong đầu? Hay là một dụng cụ có giá trị trong ngành nghiên cứu âm học?
Câu hỏi thì rất nhiều, nhưng nếu để xét về tư liệu mà người Việt viết thì lại ít. Với phong trào gần đây của cộng đồng quốc tế, nhiều bác mới vào thú chơi này chắc cũng sẽ không khỏi băn khoăn.

Cũng điên là vì dân có hiểu biết không phải là không có, nhưng để mà thật sự viết ra nhiều ông... lười.
Thôi được rồi, em thua được chưa... Sau mấy tháng lận bị hỏi liên tục thì yêu cầu của các bác đây: thằng mắc dịch dí đít ở blog này sẽ cố gắng giải thích cho các bác tất tần tật cơ bản về Frequency Response graph.

Thắt dây lưng và chuẩn bị đi các đồng chí. Bài viết này sẽ có rất nhiều điều để nói đây ;)

Trước khi đọc bài viết, nếu đây là lần đầu vào trang của các bác, xin hãy đọc trước bài này trước khi đưa ra bình luận về bài biết của em.

Lưu ý: Bài viết này sẽ có một vài câu từ sai so với ngữ pháp tiếng Việt, thường em ko nói điều này nhưng các bác theo blog biết em chuyên viết bài bằng Tiếng Anh hơn là Việt rồi đấy

Nếu bác nào muốn hỏi em sau bài viết này, có thể bấm vào nút dưới đây để vào Discord của em hóng trà bàn đạo :)


I. Khái niệm cơ bản

1. Biều đồ phổ tần đáp tuyến là cái gì thế?

Chắc hẳn các bác qua blog này đều đã nhìn thấy 1 thứ dăm ba kiểu như này rồi.

Đây là một Biểu đồ phổ tần đáp tuyến hay tiếng anh là "Frequency Response graph". Chức năng chính của nó là ghi lại áp suất âm thanh mà một thiết bị phát âm như tai nghe/loa/headphone tại một dải tần số nhất định. Tai khác nhau thì đáp tuyến sẽ khác nhau và Biểu đồ Phổ tần đáp tuyến là nhân tố ghi lại điều đó.

Một phổ tần đáp tuyến cũng sẽ có nhiều cách để ghi lại, tuy nhiên với REW (RoomEQ Wizard) thì chúng thường được ghi lại bằng cách quét một âm sóng sin rồi ghi lại độ lớn của từng bậc tần số bằng microphone. Nếu các bác không hiểu đó là gì thì có thể nghe qua cái này.

Tất nhiên, đây không chỉ là cách duy nhất, với một vài công cụ/phần mềm khác, ta có thể sự dụng âm nhiễu trắng (White noise) hay nhiễu hồng (Pink noise). Nhưng ta sẽ không bàn đến cái đó ở đây.

Với 1 biểu đồ phổ tần đáp tuyến (Em sẽ gọi tắt là Biểu đồ đáp tuyến), thì trục tung (dọc) sẽ luyên ghi lại áp suất âm thanh mà Microphone nhận được, trục hoành thì sẽ là tần số. Một Biểu đồ đáp tuyến do em cấp sẽ luyên được biểu diễn trong khoảng từ 20Hz cho đến 20kHz, hay nói cách khác trong khoảng con người nghe được.

Một đáp tuyến có quan hệ mật thiết với việc thể hiện hòa âm của nhạc cụ, nên nhớ, khi một nốt nhạc cất lên thì không chỉ tần số của nốt nhạc đó được cất lên mà đến cả các hòa âm của nó cũng vậy.

Bác nào học Vật Lí rồi chắc sẽ nhớ đến bài "Đặc trưng vật lí của âm" đấy.

Dù sao em nghĩ nhiều bác có học nhưng chắc chưa chứng kiến hiệu ứng ra sao. Giả sử như tiếng Violin đang cất lên nốt ở tần số 440Hz (Họa âm cơ bản) thì các tần số tiếp theo tại 880Hz, 1320Hz... sẽ được cất lên theo.

Nhớ cái này vì tí nữa sẽ cần.

2. Tốt, vậy đọc nó như thế nào?

Ừ... bây giờ mới bắt đầu đau đầu này.

Trước tiên thì em sẽ tiến hành phân tích biểu đồ đầu bài viết trước.

Cách thể hiện Biểu đồ:

  • Trục hoành chạy từ 20Hz - 20000Hz theo cách chia logarit (log scale)
  • Trục tung từ 60dB cho đến 110dB
  • Làm mượt ở mức 1/12

Phân tích dữ liệu từ 20Hz đến 20000Hz:

  • Phẳng từ 20Hz đến 800Hz
  • Dâng lên khoảng 10dB và đạt đỉnh tại 2700Hz, sau đó tụt dốc
  • Đạt tới 1 đỉnh khác tại 11000Hz, 15000Hz và 17000Hz

Cơ bản chỉ thế thôi. Em chia việc phân tích của em ra làm 2 phần: Biểu diễn và Dữ liệu. Hai cái này khá là quan trọng và đúng ra nên hiểu cùng 1 lúc, nhưng để hiểu ảnh hưởng của cách biểu diễn, thì em sẽ nói sơ qua về cách em phân tích phổ theo cách nhìn chung trước đã.

2.1 Phân tích dữ liệu

Nếu phải phân tích ra chất âm của con tai này thì nhiều bác sẽ cho con Etymotic này có bass phẳng và nhấn tại dải trung cao và thụt dải treble. Về cơ bản thì em không phản đối việc phân tích như thế, nhưng em thì sẽ gói gọn lại trong 1 câu: "Chất âm trung tính kiểu Diffuse Field".

Diffuse field, trung tính? Cái đó là gì đấy, giải trung cao? Chú vừa tả dải cao đấy thằng ngu ạ

Nói đúng thật ra thì một cái mic không nói dối, nhưng cách phân tích sẽ khác nhau với mỗi người. Đâm ra nhiều bác mới gặp vấn đề khi nghe người khác mô tả.
Tất nhiên là ta có một quy chuẩn để nói là một người phân tích phổ sai, nhưng ở giữa đó thì khá là khách quan thôi.

Nhưng dù sao để cho tránh rối rắm, và cùng là để phục vụ việc các bác hiểu bài viết của em hơn, đây là cách em thường chia phổ.

  • Dải trầm thấp (Subbass): 20Hz - 100Hz
  • Dải trầm trung (Midbass): 100Hz - 250Hz
  • Dải trung thấp (Lower midrange): 250Hz - 700Hz
  • Dải trung (Midrange): 700Hz - 2000Hz
  • Dải trung cao (Higher midrange): 2000Hz ~ 5500Hz
  • Dải cao thấp (Lower treble): ~5500Hz ~ 7000Hz
  • Dải cao trung (Mid treble): ~7000Hz - 10000Hz
  • Dải cao (High treble): 10000Hz+

Thông thường em coi những con số này chỉ mang tính tượng trưng, trong nhiều trường hợp thì em sẽ dựa vào cách chia như thế này, nhưng tùy thuộc vào tai mà những con số này sẽ xê dịch. Ví dụ:

Với Sony IER-Z1R chẳng hạn, em coi dải trầm từ 20Hz cho đến 300Hz. Tức là dấn vào 50Hz vào dải trung. Cái này thì cơ bản thôi, dải bass của của Z1R dâng lên từ 300Hz trở xuống mà:

Với Campfire Polaris. Em coi dải bass của Polaris nằm ở 20Hz cho đến 250Hz như thường. Và dải Trung thấp sẽ chạy từ 250Hz đến 800Hz, tức dấn vào 100Hz so với chuẩn em đề bên trên.

Đại khái là các bác hiểu rồi đấy. Tùy vào đặc tính của con tai mà em có thay đổi cái khung này thường xuyên. Điều này giúp em linh động trong quá trình mô tả đặc tính tai nghe và đáp ứng kịp thời với những người khác khi bàn luận.

Tất nhiên, mọi việc phân tích dữ liệu này đều khá dễ dàng trên website của em, nhưng ngoài việc em minh bạch đưa ra cách thể hiện dữ liệu thì còn 1 nhân tố nữa.

2.2 Cách trình bày dữ liệu

Nhận biết được cách trình bày dữ liệu của Biều đố đáp tuyến thường là điều đầu tiên em làm và em khuyên luôn tuyệt đối phải nhớ để ý cái này trước tiên. Trên thị trường không hề thiếu hãng tai nghe trình bày phổ khá là kém kể cả họ có ý đồ che giấu khách hàng hay không. Bằng không các bác sẽ vướng phải một số trường hợp như thế này.

Đây là 1 graph do em dựng bừa lên, nếu nhìn không thì Tai nghe "A" mang thiên hướng khá phẳng, và bắt đầu hạ dần từ 1500Hz trở đi. Nó nhỉnh hơn con "Hãng B" (Ừ, nó tên "Hãng B") ở dải cao một chút.

Cái điều này nhìn sẽ không sao, cho đến khi các bác phát hiện ra em đang để trục tung chạy từ -200dB cho đến 185dB. CÁCH BIỆT GIỮA KHOẢNG THẤP NHẤT VÀ CAO NHẤT QUÁ LỚN.
Giờ chuyện gì xảy ra nếu như em hạ nó về một scale nhỏ hơn?

Thử lấy từ 20 đến 100dB nhé

Bỏ qua việc tai 2 phổ này hoàn toàn nhìn khá là lộn xộn đi (Em vẽ bừa mà). Các bác có thể thấy ảnh hưởng của việc đặt trục tung nó ảnh hưởng đến việc trình bày phổ rồi đấy.

Ngoài cái đó ra, một số hãng tuy có thể sử dụng trục tung nhìn một cách có điều độ, nhưng vẫn còn 1 nhân tố nữa.

Để cho sinh động, em sẽ lấy biểu đồ này làm ví dụ:

Wow, nhìn này, phổ này có bass dâng lên từ 300Hz trở xuống, từ 800Hz cũng có dâng lên tầm 10 - 12dB cho đến khi hạ xuống ở 8kHz. Phân tích quá dễ phải không?

Ừ, các bác có nhìn thấy quen không? Nó chính là phổ của con IER-Z1R mà em vừa cho các bác xem ở đầu bài đấy

Thao tác mà em vừa cho các bác xem là Smoothing hay là "Làm mượt". Việc này không phải là hiếm trong lĩnh vực đo đạc. Nhưng nếu quá tay thì hệ quả như trên đấy. Hệ quả? Nhiều thông tin bị mất đi, dẫn đến việc phân tích dữ liệu không được toàn vẹn.

Như em đã nói, không hề có gì xấu trong việc thực hiện thao tác làm mượt cả, thực tế nếu không có nó thì một số công vụ như phân tích dữ liệu đo loa/phòng sẽ hơi đau đầu. Nhưng với thiết bị hệ pha cực tiểu (aka Headphone hay IEMs), thì việc làm mượt thường không nhất thiết phải mạnh tay. Hoặc thậm chí có thể bỏ hẳn, nhưng cũng khá tùy.

Giả sử như nếu việc đo đáp tuyến được thực hiện bằng phường pháp chạy âm nhiễu trắng/hồng (White/Pink Noise): thực hiện phương thức này thường yêu cầu xếp chồng sau đó lấy trung bình - Cách này tốn nhiều thời gian hơn để có 1 phổ đễ đọc.
Việc làm mượt phổ giúp tiết kiệm thời gian cho việc này

Việc trình bày phổ sẽ tùy theo từng reviewer hay nhà sản xuất, đối với em thì em luôn giữ phổ em trình bày như đã đưa ở trên.

  • Trục hoành chạy từ 20Hz - 20000Hz theo cách chia logarit (log scale)
  • Trục tung từ 60dB cho đến 110dB
  • Làm mượt ở mức 1/12

Giữ cách trình bày dữ liệu đẹp (hoặc ít nhất là đọc được) là điều khá là quan trọng trong cung cấp thông tin một cách minh bạch cho người đọc. Nên các bác đọc phổ luôn nhớ để ý những điều này và tự hỏi về những yếu tố trên trước khi tiến hành đọc dự liệu.

3. Đối chiếu dữ liệu

Một trong nhưng lợi thế của việc sử dụng phổ là việc đối chiếu dữ liệu và dự đoán chất âm. Tất nhiên điều này chỉ mang tính tương đối nhưng ít nhiều gì cũng là thông tin hữu ích cho nhưng ai muốn mua hàng.

Cơ sở dữ liệu đáp tuyến của em có cài sẵn một công cụ cho phép các bác đối chiếu và so sánh dư liệu các phổ tai khác nhau với hơn 300+ mẫu đo được.

Truy cập tại đây: https://banbeu.com/vn/graph/tool/

Thao tác đối chiếu phổ cũng yêu cầu một số hiểu biết nhất định, nhưng để điểm qua những cái cơ bản thì.

3.1 Chuẩn hóa (Normalization)

Việc chuẩn hóa nói ở đây là đưa các biểu đồ đáp tuyến so sánh với nhau theo 1 mốc nào đó. Thông thường với công cụ trên website của em, mặc định việc chuẩn hóa sẽ xét theo độ lớn nghe được.

Theo hướng tiếp cận này thì thường mọi thứ có vẻ rõ hơn rồi. Với 1 số người, việc chuẩn hóa được thực hiện dưới hướng khác nhau nhằm lấy được nhiều thông tin nhất có thể. Việc chuẩn hóa ra sao hoàn toàn phụ thuộc cảm tính của các bác.

Một lần nữa em nói lại, ta đang dự đoán, chứ không nghe, thế nên những thao tác này chỉ giúp cho các bác chuẩn bị điều gì có thể xảy ra nếu các bác nghe thôi.

Còn nếu nghe rồi thì đây là một công cụ hữu hiệu để xác thực lại nguyên nhân, với những ai có chơi EQ thì càng hữu dụng trong việc xử lý vấn đề trong dải âm.

Hãy lấy ví dụ với việc em so sánh giữa 64Audio U12t và 64Audio Fourte Noir nhé.

Trong việc đối chiếu đáp tuyến này thì các bác có thể kết luận rằng Fourte Noir có dải trung thụt và một đỉnh treble trên 13kHz so với U12t. Cái cách nhìn này thoạt qua thì không sai trong tình huống em phải nghe 2 con tai với mức âm lượng như nhau.

Nhưng nếu xét theo cảm nhận thực tế của em thì

  1. Fourte Noir không hề có cảm giác thụt mid như graph, thậm chí uppermid khá tiến
  2. Fourte Noir khá là ấm và hơi ồm
  3. Phần dải cao thì khá chuẩn, mặc dù đáp tuyến tại đó sẽ gặp vấn đề về độ chính xác. (Sẽ đề cập sau)
  4. U12t có phần hiền hơn tẹo

Biết những điều này, thay vì chuẩn hóa cùng âm lượng, em chuẩn hóa lại phổ tại mức 2000Hz vì cả hai con tai đều có cùng pinna gain tại đó

So sánh này gần hơn so với cảm nhận của em giữa Fourte Noir và U12t.

Ngoài việc này ra, nhiều reviewer cũng thường có 1 "chuẩn vàng" trong cách trình bày nhưng phổ như thế này - chuẩn hóa tại 1000Hz.

Ý em là... nó nhìn ổn, nhưng trong một vài tình huống thì sẽ có cách tối ưu hơn. Nếu các bác chuyển sang chuẩn hóa chung mức âm lượng thì cũng chẳng khá khẩm gì hơn

Giờ để ý nhé, cả 4 mẫu Voyager 3 này đều có chung một dải bass, thành ra trong so sánh này, cái mà ta muốn thể hiện hơn sẽ là mức chênh lệch từ dải mid trở đi. Việc chuẩn hóa sẽ thực hiện tại 200Hz

Tốt hơn rồi, và điều này cũng giúp việc so sánh đơn giản hơn một tẹo.

3.1.1 Mở rộng

Một đáp tuyến có quan hệ mật thiết với việc thể hiện hòa âm của nhạc cụ, nên nhớ, khi một nốt nhạc cất lên thì không chỉ tần số của nốt nhạc đó được cất lên mà đến cả các hòa âm của nó cũng vậy.

Thể hiện như thế nào thì giờ em sẽ cho các bác thấy. Hãy lấy thử ví dụ về dây đàn Violin lúc nãy được kéo và ghi lại giữa Sony IER-Z1R và ThieAudio Legacy 2 nhé

So sánh họa âm và đáp tuyến giữa ThieAudio Legacy 2 và Sony IER-Z1R

Bằng việc thực hiện thao tác chuẩn hóa tại họa âm cơ bản (440Hz), các bác có thể thấy độ chênh lệch của các họa âm với nhau cũng được thể hiện trên đáp tuyến

  • Họa âm bậc 2 (880Hz) và 3 (1320Hz) có phần nhỉnh hơn tại IER-Z1R: Có thể hiện trên phổ
  • Họa âm bậc 5, 6, 7 thấp hơn: Có thể hiện trên phổ (2000Hz - ~3500Hz)
  • Các họa âm có tần số từ 5kHz của ThieAudio Legacy 2 trở lên hầu như đều thấp hơn IER-Z1R: Có thể hiện trên phổ

Như đã nói rồi đấy, Việc ghi lại đáp tuyến của tai nghe sẽ giúp các bác hình dùng đại khái nhạc cụ được thể hiện ra sao ở một mức nào đó. Và đồng thời đây cũng là 1 công cụ mạnh để hỗ trợ cho các bác nếu các bác muốn EQ. Nhưng, em sẽ viết một bài về cái đó sau.

3.2 Bù trừ (Compensation)

Thao tác bù trừ (Compensation) thường được thực hiện nhằm để thấy rõ hơn sự khác biệt giữa các đáp tuyến với nhau. Cái này thì thường dùng trong 1 phổ tươi (Raw graph) và để so sánh với các Đáp tuyến mục tiêu (Frequency Response Target).

Phổ tươi (Raw graph) là gì? Tức là phổ lấy gốc từ thiết bị đo và chưa hề qua việc xử lý dữ liệu. Toàn bộ Biểu đồ đáp tuyến mà em cho các bác xem từ nãy giờ đều là phổ tươi theo bộ đo chuẩn IEC 60318-4 của em.
Việc giải thích về "Đáp tuyến mục tiêu" không nhất thiết phải đọc nhưng em sẽ đề cập sau.

Cái này chắc không phải giải thích nhiều, bản thân việc bù trừ diễn ra đúng như tên gọi của nó: Lấy 1 đáp tuyến làm gốc, sau đó thực hiện việc cộng trừ với những đáp tuyến khác. Kết quả cho ra là một biểu đồ so sánh mà các bác chỉ cần nghĩ "phẳng" = gần với đáp tuyến gốc.

Ừ, nếu bác đang nghĩ đến cái này có liên quan gì đến việc trình bày phổ hay không thì đúng rồi đấy. Nhà sản xuất hoàn toàn có thể thay đổi phổ được trình bày bằng phương pháp bù trừ. Nếu có biểu hiện sử dụng bù trừ các bác nên yêu cầu hoặc kiếm nguồn đo uy tín mà các bác biết.

Nếu các bác đọc được đến đây thì em nghĩ các bác đã nắm rõ cơ bản rồi đấy, tất nhiên, nếu chỉ là trong hệ thống phổ em đo, các bác hoàn toàn có thể có thể đọc được đến mức nào đó.

Nhưng tại sao lại phức tạp thế này? Tại sao lại có vụ phổ tươi ở đây? Tại sao phổ tươi lại không "phẳng".

Đúng rồi đấy, "Phẳng" trên phổ đo IEM hay Headphone không có nghĩa là thật sự phẳng với tai các bác đâu. Nếu muốn biết lý do, các bác có thể đọc tiếp bên dưới.


II. Head-Related Transfer Function (HRTF), đáp tuyến mục tiêu và hệ thống đo đáp tuyến dành cho Tai nghe/Headphone

1. Tản mạn về Head-Related Transfer Function (Hàm truyền liên quan tới vùng đầu)

Gu mỗi người khác nhau, mỗi người nghe khác nhau. Cái này thì ta không hề có gì để bàn cãi rồi. Thế nhưng trong thực tế thì đó không chỉ là điều duy nhất, thực chất, cách mà các bác tiếp nhận âm thanh tùy thuộc vào tín hiệu xuất phát từ đâu mà cũng sẽ khác.

Cái này chắc các bác chơi loa có thể hiểu được đôi phần, nhưng em đang không nói đến vị trí loa ở đây, với IEM hay Headphone, cách thức tune âm cũng sẽ cực kì khác so với môi trường tự do (Aka, trong 1 cái phòng) do chính thiết kế của những thiết bị này.

Head-Related Tranfer Function (viết tắt là HRTF) hay em tạm dịch là (Hàm truyền liên quan đến vùng đầu) biểu thị đáp tuyến âm thanh mà tai người nhận được. Em biết đây hoàn toàn là một khái niệm khá xa lạ với nhiều bác và nhiều ông marketing bắt đầu đánh tráo khái niệm cái này sang một kiểu công nghê mới.

Không, cái này đơn giản chỉ nói về phần tín hiệu âm thanh mà tai bác nhận được thôi. Nhìn chung thì mỗi người đều có 1 HRTF khác nhau, nhưng ảnh hưởng khi bỏ qua một vài giá trị thì tương đồng nhau.

Tại sao? Âm thanh khi đến tai bác dội vào đầu, vào thân, vào người... chúng khuếch đại, triệt tiêu lẫn nhau. Kết quả là cho đến khi màng nhĩ các bác rung thì ta thu được 1 tín hiệu cực kì khác so với 1 cái mic thu được.

Hay nói cách khác, điều này đồng nghĩa với việc nếu bác bỏ bất kì một bộ phận trên cơ thể người, tín hiệu thu được so với 1 mic trường tự do sẽ có chênh lệch khá lớn. IEM và Headphone là hai ví dụ điển hình vì tín hiệu âm thanh hoàn toàn bỏ qua phần đầu, và thậm chí là cả vành tai của các bác.

Credit: Innerfidelity

Những hao hụt đó thường sẽ được các nhà tune tai họ dâng lên để bù lại: Với In-Ears, đó được gọi là Pinna gain (Bù phần vành tai)
Với Headphone, đó được gọi là Head gain (Bù phần đầu)

Ngoài lề: Việc đo HRTF riêng cho từng người là hoàn toàn có thể, nhưng nó không chỉ là câu truyện đơn giản của việc nhét 1 cái mic nhỏ xíu vào trong tai thôi đâu. Nhưng đó là câu truyện cho một buổi khác.

2. Sự hỗn loạn của các đáp tuyến mục tiêu

Gu mỗi người khác nhau, mỗi người nghe khác nhau. Cái này thì ta không hề có gì để bàn cãi rồi.

Cộng thêm cả kiến thức về HRTF mà em vừa giới thiệu cho các bác và giờ ta có một vấn đề: Thế nào là phẳng?

Như đã nói, dưới ảnh hưởng của việc bỏ qua các bộ phận cơ thể do thiết kế của IEM/Headphone, việc tín hiệu đến tai các bác sẽ không hề phẳng và quá trình tune âm một phần cùng nhằm bù trừ cho những hao hụt này. Phổ tươi cho các bác biết được những thao tác bù trừ đó được thực hiện ra sao (nếu dữ liệu đó tôn tại)

Nói lại lần nữa, phổ tươi chỉ là biểu đồ đáp tuyến gốc đo ra từ thiết bị và không hề thực hiện một thao tác tinh chỉnh giá trị nào.

Tất nhiên, biết cái này vẫn chưa trả lời câu hỏi đề bài, thành ra ta mới có thao tác "Bù trừ" (Compensation)

Việc bù trừ theo một đáp tuyến mục tiêu lý tưởng nhất hướng tới việc thể hiện 1 graph theo hướng "phẳng" theo cách đo trong phòng. Tất nhiên không phải mọi đáp tuyến mục tiêu đều hướng đến việc thể hiện phổ theo hướng này; Banbeucmas Preference Target của em là một ví dụ. Đáp tuyến mục tiêu em đề ra vốn là 1 dải âm nhằm diễn tả màu âm mà em đã biết mình đã thoải mái, chứ không phải là 1 đáp tuyến mục tiêu để xác định thế nào là "phẳng".

Như đã nói, "Phẳng" trên phổ tươi không phải là "Phẳng" khi tín hiệu đến tai. Nếu bác công nhận việc "phẳng" = "trung tính" với 1 phổ đo từ mic trường tự do (aka trong 1 căn phòng) thì giới khoa học cũng sinh ra muôn hình vạn trạng Đáp tuyến mục tiêu để tái hiện điều này với IEM/Headphone.

Ngay cả trong phạm vi xác định đáp tuyến phẳng trong môi trường phân tán (Diffuse Field) và ta có một đống kết quả luôn này. Với công cụ so sánh phổ tần thì em có cấp 2 đáp tuyến DF của Hammershøi & Møller Etymotic.

Đáp tuyến DF của Hammershøi & Møller
Đáp tuyến DF của Etymotic

Ngoài ra thì trong những năm gần đây nổi lên một đáp tuyến mới đến từ viện nghiên cứu Harman International do tiến sĩ Sean Olive phát triển. Dải âm của Harman thường xuyên được tinh chỉnh vì mục tiêu chính của nó vốn để tìm đáp tuyến mà nhiều người thấy ổn nhất, và điều này thay đổi từng năm.

Đáp tuyến mục tiêu Harman bản 2019v2

Với những điều mà em kể trên thì chắc các bác cũng nắm được kha khá rồi. Bản thân việc bù trừ với các dải âm không nhất thiết sẽ thông dịch được ra thành "phẳng" khi nghe. Cũng như trung tính cũng có thể coi thành nhiều khoảng thay vì 1 giá trị vàng nhất định.

Đó là lý do rất nhiều công cụ so sánh phổ cho phép các bác sử dụng nhiều đáp tuyến mục tiêu với nhau nhằm đáp ứng các như cầu của nhiều người.

Và nhắc đến việc ta có nhiều chuẩn đáp tuyến, việc có một công cụ để đo thiết bị trợ thính hay headphone cũng phức tạp không kém.

2.2 Giả lập đo tín hiệu âm thanh

Tất nhiên, nếu xét về khoảng headphone/IEM thì các bác dùng gì đo cũng được. Và nếu phải nói đến trình DIY thì các thánh nước ngoài sáng tạo lắm

Ô hô nhìn giống ngôi nhà quá - Credit: DIY-Audio Heaven

Đây chỉ là một trong những cách các bác đo tín hiệu âm thanh từ Headphone thôi; một số bộ đo nhà làm này thì nhìn khá buồn cười và không "thực tế" lắm rồi. Bác muốn đo tín hiệu đến màng nhĩ, tức là phải xem hiệu ứng của âm thanh qua các bộ phận cơ thể. Một tiêu chuẩn như thế tồn tại và đã là thứ mà giời nghiên cứu đã phát triển xuyên suốt hơn 30 năm nay. Nhưng để nói về giá thành thì... Khóc.

Giả lập thân mình và đầu B&K 4128 - Credit: acousticfield.blogspot.com

Tất nhiên nếu phải ví trong khuôn khổ headphone và IEM/Earbuds, thì ta có thể bỏ phần thân - âm thanh lúc đó sẽ chỉ chạy vào vành tai và lỗ tai thôi mà. Điều khá đáng tiếc là kể cả có bỏ những bộ phận đó đi thì giá thành vẫn... Khóc

Thực chất thì với hàng rẻ nhất thì ta có MiniDSP EARS. Với giá thành tầm 5 triệu thì các bác có hẳn cả 1 setup có cả vành tai lẫn mic đằng sau. Quá rẻ, quá tuyệt với phải không?

Credit: MiniDSP

Khá là đáng tiếc là hệ thống này có khá là nhiều nhược điểm. Từ việc vành tai quá cứng, ống tai được thiết kế cực kì thiếu thực tế so với tai người và trên hết là nó cực kì thiếu tính ổn định. Thực hiện đo đạc trên bộ đo này với tần suất và mật độ như em (Một người đã đo và nghe hơn 300 mẫu tai khác nhau) là một thảm họa vì giữ cho tai cố định so với các mẫu khác là cả một cực hình. Đây là còn chưa kể file bù trù được cung cấp cũng khá là nực cười.

Tại sao phổ bù trừ DF cho IEM lại roll off hết thế kia? Nghe khá vô lý - Credit: csglinux (Head-fi)

Cũng phải nói trước là lựa chọn như MiniDSP không tồi cho việc so sánh trong cùng một bộ đo và cùng 1 phương thức thực hiện (Và như đã nói ở trên... MiniDSP EARS khá tù về vụ này). Thực tế thì mọi so sánh đều tối ưu nhất nếu rơi vào chung 1 môi trường.

Nhưng với mật độ dữ liệu đo đạc kiếm được ngày nay, em không khuyên sử dụng MiniDSP EARS lắm, nó không theo một chuẩn đo nào nên dữ liệu để đối chiếu trên mạng không thật sự nhiều.

Và thật sự nếu ai đọc hướng dẫn sử dụng cũng nên biết đến MiniDSP cũng không khuyên sử dụng thiết bị này trong việc nghiên cứu và phát triển lắm.

Nhắc đến chuẩn đo, có lẽ cùng đến lúc rồi.

2.3 Chuẩn đo dành cho tai nghe nhét tai IEM (IEC 60318-4)

Tất nhiên là trong suốt thời gian lĩnh vực này phát triển thì đã luôn có 1 chuẩn đo được thống nhất và hoàn thiện cho tới ngày nay. IEC 60318-4 (Tiền thân là IEC 60711) là mã chuẩn đo được Ủy ban kĩ thuật Điện Quốc Tế (International Electrotechnical Commission - IEC) đề ra dành cho giả lập ống tai người. Thiết bị này có thể sử dụng trong việc thiết kế thiết bị thính lực hay dùng trong nghiên cứu. Banbeucmas Hobby Lounge cũng sử dụng một thiết bị tương tự như vậy.

Cũng phải nói trước là em sẽ chỉ nói đến giả lập ống tai ở đây. Việc làm 1 thiết bị đo tai nếu biết đủ thông tin làm có thể thực hiện được nhưng em sẽ không ban đến điều đó trong bài viết này. Nếu các bác muốn biết thêm thông tin có thể tra trang chính của cơ sở dữ liệu đo mà em duy trì

Nghe thì có vẻ hơi thô. Dù sao thì cái thứ này cũng chỉ là một cái ống sắt được thiết kế để đo tai IEM thôi, câu truyện chưa dừng ở đó nếu các bác định lắp một cái giả lập vành tai để đo headphone nhưng đấy lại là cả 1 mớ bòng bong khác mà em ko muốn kể đến ở đây.

Dù sao thì việc chuẩn IEC 60318-4 được xây dựng trên những đặc tính này cũng sẽ ảnh hưởng đến phổ tươi sau khi đo. Nhưng để nói chung thì tại dải cao, biểu đồ đáp tuyến từ thiết bị đo này sẽ luôn có 1 đỉnh nhọn tùy vào con tai đo được (Đỉnh cộng hưởng). Càng đút sâu, thì cái đỉnh này càng dịch về phía tần số cao hơn.

Ảnh hưởng này thực tế tai người cũng có ghi nhận, nhưng ở một mức thấp hơn rất nhiều. Đây cũng là lý do tại sao việc thay tip sẽ có thay đổi ở dải cao, sau cùng thì với một vài loại tip khác nhau thì đỉnh cộng hưởng cũng sẽ thay đổi theo.

Dù sao thì với cơ sơ dữ liệu mà em cung cấp, mọi đỉnh cộng hưởng đều sẽ được cố định ở mức gần 8000Hz nếu trường hợp cho phép.

2.4 Tản mạn về thiết bị đo chất lượng cao

Tuy bộ đo của em vẫn nằm trong khuôn khổ chấp nhận được với chuẩn mà IEC đề ra, vấn đề ở đây là chính những bộ đo này vẫn có đặc tính riêng của nó. Đây là một vấn đề mà rất nhiều dân chơi Audio có dấn thân vào chủ nghĩa khách quan gặp phải và giới nghiên cứu cũng cố tìm giải pháp.

Một trong những cách tiếp cận tiêu biểu để xử lý vấn đề mà các thiết bị đo IEC 711 truyền thống mặc phải là thiết bị đo "có độ phân giải cao" RA040X của GRAS. Mục tiêu chính của những thiết bị này là là giảm độ lớn của đỉnh cộng hưởng.

Thiết bị này cũng được GRAS quảng bá bảo đảm việc tham chiếu với đáp tuyến đo bằng chuẩn IEC 60318-4 gốc vẫn có thể diễn ra được miễn là người dùng biết được những đặc tính trên.

Và đồng thời, đây cũng là chuẩn mà Harman sử dụng để phát triển nghiên cứu của họ, cũng là lý do chính tại sao việc sử dụng đáp tuyến của Harman (và nhiều đáp tuyến khoa học khác) có thể sử dụng cùng với khá nhiều cơ sở dữ liệu đo dải âm mà các bác tìm thấy trong cộng đồng hiện nay.

So sánh giữa giả lập ống tai người IEC 60318-4 và RA040X
Lưu ý: Dữ liệu này được tính toán từ các mẫu tai khác nhau mặc dù cùng loại nên giá trị sẽ có chênh lệch cao hơn so với cùng 1 mẫu tai. Sắp tới em sẽ gửi một vài con tai em đo ra một viện nghiên cứu để có phân tích chuẩn xác hơn.

Tất nhiên là kể cả một thiết bị đo chất lượng cao thì cũng vấn sẽ gặp một vài ý kiến trái chiều. GRAS tập trung vào giảm đỉnh cộng hướng đã rấy lên câu hỏi liệu thiết bị đo này có thật sự chính xác hơn không hay chỉ giúp phần đọc dữ liệu dễ hơn. Đây là còn chưa kể việc chuẩn IEC 60318-4 vốn được GRAS dựa vào vẫn chưa được kiểm chứng hoàn toàn về độ chính xác dưới 100Hz [1]

Gần đây thì cũng có 1 chuẩn mới vốn sinh ra để giải quyết 2 vấn đề này cùng 1 lúc: Thiết bị giả lập thân mình và đâu Brüel & Kjær 5128. Thay vì sử dụng ống sắt như 60318-4, thiết bị này (Chính xác hơn là B&K 4620) dựa vào mô phỏng dữ liệu trong ống tai người rồi lấy trung bình.  [2]

Tuy nhiên đây là 1 chuẩn mới và hiện tại vẫn còn khá nhiều công cuộc để phát triển so với chuẩn đo đã qua hoàn thiện và sử dụng trong khoảng 40 năm. Việc nó "chính xác" ra sao và hoàn toàn có thể tin cậy trong nghiên cứu và phát triển hay không vẫn còn phải chờ.


Lời kết:

Xét cho cùng thì với độ tâm linh của thú chơi Audio, phổ tần đáp ứng cũng chỉ là 1 một công cụ phục vụ cho việc đánh giá tai nghe cũng như dành cho mua hàng.

Bài viết này chỉ mang tính tham khảo ban đầu cho những ai có hứng thú, còn nếu muốn có thêm kinh nghiệm đọc, thì ta cũng phải đi đôi với việc nghe. Chịu khó nghe và tìm hiểu thì các bác sẽ tối ưu được công cụ này hết mức.

Hi vọng các bác đã học được điều gì đó mới trong bài viết này, còn giờ em đi ăn tối đây

À vâng có Kato với Bravery rồi, nhưng chắc đợi cuối tháng em mới có bài viết đánh giá chất âm

Giấy tờ liên quan:

  1. IEC 60318-4 Ed. 1.0 (2010) Simulators of human head and ear – Part 4: Occluded-ear simulator for the measurement of earphones coupled to the ear by means of ear inserts tại International Electrotechnical Commission.
  2. Darkner, S., Sommer, S., Baandrup, A. O., Thomsen, C., & Jønsson, S. An Average of the Human Ear Canal: Recovering Acoustic Properties with Shape Analysis. Cornell Univ. Libr., từ ArXiv e-prints năm 2018.

Cảm ơn 2 bác đã ủng hộ Patreon của em

Not Daijoubu
Spacemanspiff