WO2006030712A1 - 楽曲推薦装置及び方法 - Google Patents

楽曲推薦装置及び方法 Download PDF

Info

Publication number
WO2006030712A1
WO2006030712A1 PCT/JP2005/016642 JP2005016642W WO2006030712A1 WO 2006030712 A1 WO2006030712 A1 WO 2006030712A1 JP 2005016642 W JP2005016642 W JP 2005016642W WO 2006030712 A1 WO2006030712 A1 WO 2006030712A1
Authority
WO
WIPO (PCT)
Prior art keywords
music
range
user
search keyword
update
Prior art date
Application number
PCT/JP2005/016642
Other languages
English (en)
French (fr)
Inventor
Satoshi Odagawa
Fumio Matsushita
Yasuteru Kodama
Original Assignee
Pioneer Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corporation filed Critical Pioneer Corporation
Priority to JP2006535849A priority Critical patent/JPWO2006030712A1/ja
Publication of WO2006030712A1 publication Critical patent/WO2006030712A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process

Definitions

  • the present invention relates to a technical field of a music recommendation device and method used in, for example, powerful audio and stereo that can provide music according to the user's sensibility from among a large number of music.
  • Patent Document 1 According to the information selection / playback apparatus described in Patent Document 1 (hereinafter referred to as "conventional technology"), a search keyword (for example, spectacular music, scat Up to and including the correlation values between the feature words (for example, brightness, darkness, enjoyment, spirit, goodness, etc.) , And a feature word list in which the presence / absence of features related to each feature word is described.
  • search keyword for example, spectacular music, scat Up to and including the correlation values between the feature words (for example, brightness, darkness, enjoyment, spirit, goodness, etc.)
  • a feature word list in which the presence / absence of features related to each feature word is described.
  • the characteristics of the user's sensitivity are quantitatively extracted depending on the power of the selected music, for example, whether or not the user skipped, and the correlation value of the sensitivity table is updated.
  • the Kansei table is updated to reflect the user's Kansei, so that it is possible to select content corresponding to the Kansei of the individual.
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2003-132085
  • the present invention has been made in view of the above-described problems, and an object of the present invention is to provide a music recommendation device and method capable of recommending appropriate music for each user.
  • the music recommendation device of the present invention is quantified for each of n (where n is a natural number) feature items predetermined to represent the characteristics of each of a plurality of music pieces.
  • a range setting that sets a first range that defines a range that includes the n pieces of music feature values assigned to each of a plurality of search keys in an n-dimensional coordinate system having music feature values as n coordinate axes.
  • input means capable of inputting a desired search keyword out of the plurality of search keywords, and when the desired search keyword is input via the input means, the plurality of pieces of music In the n-dimensional coordinate system, (i) the n music feature quantities belonging to the first range corresponding to the desired search keyword or (ii) the second range including the first range are included.
  • a first range is set that defines a range including the n pieces of music feature amounts assigned to each of a plurality of search keywords.
  • music is a concept including all music and music information that can be viewed by a user regardless of the genre, such as rock, pop, enka, jazz, or classical music.
  • the place where such music is viewed is not limited to a moving body such as a car, a room such as a home or a company, or the outdoors. Also compatible with these viewing locations
  • the situation at the time of viewing can also take various forms such as moving or stopping a moving body such as a car, working, studying, or walking.
  • the music recommendation device of the present invention is also part or all of audio equipment, in-vehicle audio equipment, car navigation equipment, portable music equipment, etc., or an external function expansion that adds functions to them. It can take various forms such as a device.
  • these music may be, for example, music included in commercially available music software recorded in advance on a CD or DVD, or the user via a network such as the Internet. May be music that has also been downloaded from a predetermined server or distributed from a predetermined sano. If the music is downloaded or distributed in this way and is acquired by the user, such music is appropriately stored on the user side by HD (Hard Disk), CD-ROM, CD-RW, DVD— It may be recorded and saved on a recording medium such as ROM or DVD RAM.
  • HD Hard Disk
  • CD-ROM Compact Disk
  • CD-RW Compact Disc
  • feature item is a parameter prepared in advance in order to categorize these multiple musical pieces.
  • “classify sensitively” means, for example, “pleasant”, “bright”, “good”, “dark”, “quiet”, “good”, etc.
  • the feature items in the present invention enable these sensibility classifications, for example, the property of music such as “rhythm”, “beat”, or “pitch” can be replaced as physical numerical values. Item power also becomes. For example, taking “rhythm” as an example, songs with slow rhythms are generally “quiet” songs, which are often “quiet” songs.
  • all of the quantifiable items having some correlation with the sensitive classification items can be “characteristic items” in the present invention.
  • the "first range” refers to each of a plurality of search keywords in an n-dimensional coordinate system with n music feature quantities quantified for each of n types of feature items as n coordinate axes. This is a range that defines a range that includes the n music feature values assigned to. Since n is a natural number, the coordinate system according to the present invention can take various forms such as a coordinate axis, a two-dimensional coordinate plane, or a multidimensional coordinate space.
  • “n pieces of music feature values are used as n coordinate axes” means that n feature items are used as coordinate axis items.
  • the coordinate value in the coordinate system may be the music feature amount itself or the music feature value. It may be a value generated or calculated from the collected amount, or a value obtained by normalizing the music feature amount. In the case of normalization, the difference between coordinate values related to one coordinate axis may be normalized so that the feature weights of the same degree are shared among a plurality of coordinate axes (that is, music feature quantities). .
  • the “search keyword” is a phrase used to select a desired music piece on the user side. For example, “fun”, “bright”, “dark”, “energetic” It refers to phrases such as “good” or “good”. That is, the search keyword is a concept also called a “sensitive word” for searching for music pieces classified as “sensitive” as described above. In the present invention, each search keyword is assigned a music feature amount in a feature item in the same manner as a music piece.
  • the first range is a range that defines a range including n pieces of music feature values assigned to each of these search keywords.
  • the “covering range” described here refers to an appropriate range including a coordinate point that truly corresponds to the music feature amount assigned to each search keyword in the n-dimensional coordinate system.
  • the search keyword indicates It is preferable that the range be considered as not deviating from the sensitivity characteristics. In the following description, it will be expressed that the sensuous characteristic power indicated by the search keyword is not deviated, and “matches the search keyword” as appropriate.
  • the coordinate system is represented by a two-dimensional coordinate plane, but the first range set for one search keyword is the search keyword. It may be a circular range corresponding to the music feature amount assigned to the.
  • an elliptical range may be used.
  • it may be a quadrangular range obtained by superimposing the range of coordinate points allowed on each coordinate axis.
  • it may be an appropriate range as a result of appropriately determining the first range as the initial value.
  • the input means The desired one is entered.
  • a search keyword such as “fun” is input.
  • An input means that enables such input is, for example, a keyboard.
  • Various forms such as a keyboard, a mouse, a scroll button, various buttons, or a touch panel device can be adopted, but as long as a user can input a search keyword in order to search for a song that the user desires to view, the form is arbitrary.
  • the recommendation unit When a search keyword is input, the recommendation unit includes a first range corresponding to the search keyword input in the n-dimensional coordinate system or a second range including the first range from among a plurality of pieces of music. One or a plurality of music pieces having n music feature quantities belonging to the range are searched and recommended to the user.
  • music recommendation reflecting the user's sensitivity is realized as follows.
  • a song belonging to the first range described above or a wider second range including the first range is recommended as a “fun” song.
  • the “second range” is a range including the first range.
  • Music that falls within the second range and outside the first range is music that is originally considered not to match the input search keyword (for example, "fun").
  • “does not match” means that it is highly likely that the feature is not the emotional feature indicated by the related search keyword and is highly likely to be seen from the music feature amount of the set feature item. It ’s not good. Therefore, depending on the user, there is a possibility that the music that exists outside the first range is felt as music that matches the input search keyword.
  • This second range may be any one as long as it includes the first range, that is, a range including a music feature amount assigned to the search keyword (preferably a range that is considered to match the search keyword).
  • the second range may be determined in advance by an empirical, experimental, or simulation technique.
  • the recommendation means uses as the range recommended to the user may be freely set. For example, music belonging to the second range may be recommended at a rate of once for the first range multiple times. Or vice versa. Alternatively, music belonging to the second range may be recommended only when the user's selection operation prompts the user to recommend music belonging to the second range.
  • one or a plurality of songs recommended in this way are viewed by the user, for example, by the user sequentially selecting from the recommended list or automatically starting to play in an appropriate order. Is done.
  • a song is “viewed”, for example, the music name, artist name, or performance time of the music to be played is visually displayed on a powerful information display panel such as a liquid crystal display panel. It is a concept that includes cases where
  • matches sensibility means that the sensibility element (for example, “fun”) entered as a search keyword matches the sensibility element that the user actually receives from this song. Point to.
  • Such determination by the determination means is performed based on, for example, whether or not the user has listened to the music piece to the end. At this time, if the song has been listened to (played back), it can be determined that the user has determined that the song matches the input search keyword. On the other hand, if the performance is stopped or skipped immediately after the performance is started or during performance, it can be determined that they do not match.
  • a dedicated button or the like may be prepared in advance for transmitting a force that matches a user's sensibility to a device, which is related to the reproduction status of the music. In this case, the button may be configured in common with the input means of the present invention.
  • the user feels that it matches the search keyword that he / she actually entered, and simply played the song according to his / her mood. The case exists. If this situation is not taken into account, the user's sensibility is studied incorrectly. Therefore, the skipping of music by the user may be excluded from the discrimination target by the discrimination means.
  • the range setting unit updates the first range corresponding to the input search keyword based on the determination result by the determination unit. More specifically, for example, when a song that falls within the second range and outside the first range is viewed to the end, the first range corresponding to the search keyword is large. Update to be. Further, even if it is within the first range, when a music piece belonging to the boundary is rejected by the user, the first range corresponding to the search keyword is updated so as to become smaller. Note that the update mode is not limited to the example illustrated here, and the first range is set so that the recommended music is closer to the user's sensibility based on whether or not the recommended music matches the user's sensibility. As long as it is updated, it may be updated in any way.
  • the first range set for each search keyword can be updated to reflect the sensitivity of the user.
  • this update can be performed bidirectionally, in other words, in a direction to further widen and narrow the first range, it is possible to recommend an appropriate piece of music for each user.
  • an extraction unit that extracts the n music feature amounts, and the extracted music feature amounts are used for each of the plurality of music pieces.
  • first storage means for storing the information in association with each other.
  • the extraction unit extracts the music feature amount for each of the plurality of pieces of music, and the extracted music feature amount is associated with each of the plurality of pieces of music and is stored in the first storage unit.
  • the music table in which music information and extracted music feature values are stored in association with each other may be created, and this music table may be stored.
  • the music information may include musical tone data for playing a musical piece, information on a storage location of the musical tone data, a musical title, or an artist name.
  • the first storage means means that if the music recommendation device according to the present invention is configured to recommend music from a predetermined recording medium such as a large-capacity HDD in advance. Such a recording medium for storing music may be used.
  • the extracted music feature values may be stored in a format that can be referred to later in a form attached to the musical tone data of the music stored in the recording medium.
  • the music setting device further includes second storage means for storing the set first range in association with each of the plurality of search keywords, and the range setting means. Updates the first range stored in the second storage means.
  • the first range set by the range setting unit is stored in the second storage unit in a form associated with each search keyword, the latest update result is reflected for each user. It is also very convenient because it can always be referred to.
  • a search table in which a search keyword name, information on the music feature amount to be assigned, information defining the first range, and the like are stored may be created and stored.
  • the second storage unit may be configured as the same hardware as the first storage unit described above, or may be configured as different hardware. Also, some of them may be configured as common hardware.
  • the determination unit determines whether or not the recommended music matches the sensibility of the user based on the individual determination of the user. To do.
  • the determination means can determine whether or not the music recommended by the recommendation means matches the user's sensitivity based on the individual determination of the user. Sensitivity can be reflected with high credibility.
  • Such individual determination by the user may be supplied to the determination means via, for example, a dedicated button or key representing “match” or “non-match”. Alternatively, it may be supplied to the discriminating means using a known voice recognition technology.
  • the range setting means is a distance of reference coordinate power specified by a music feature amount assigned to the desired search keyword in the n-dimensional coordinate system.
  • a set of points where R is R (R: positive real number) is the boundary of the first range. Set as a border.
  • the boundary of the first range is set by the range setting means as a set of coordinate points that are equidistant from the reference coordinate point in the coordinate system.
  • the “reference coordinate point” refers to a coordinate point uniquely determined by the music feature amount assigned to each search keyword in the n-dimensional coordinate system. Therefore, this reference coordinate point represents the emotional feature represented by the search keyword with the highest probability in the coordinate system.
  • “equal distance from the reference coordinate point” is, for example, in the case of a two-dimensional coordinate system, the outer periphery of a circle centered on the reference coordinate point, and the first range in that case is That is, it points within the circle.
  • the first range refers to the inside of the sphere.
  • the value setting value of “R” that defines the first range changes by reflecting the user's sensibility by the update operation as described above of the range setting means. Note that the initial value of R is set to such a value when an optimal value can be predicted, estimated, or analogized in advance by a method such as experimental, empirical, or simulation. Have you been?
  • the load required for the process of setting the first range is relatively light, and the reference coordinate point corresponding to one search keyword is set at the center of the first range. Therefore, it is possible to set the first range to a range that considers all feature items in a well-balanced manner.
  • the recommendation means includes a range obtained by enlarging the second range at a predetermined ratio in the n-dimensional coordinate system. Set to.
  • the recommendation unit sets the second range as a range obtained by expanding the first range at a predetermined rate, it is possible to reduce the processing load required for music recommendation. is there. In this case, even if the first range has a relatively complicated shape, the ratio and balance of various feature items in one search keyword represented by the first range are maintained.
  • the second range can also be set easily, and music can be recommended effectively.
  • the recommending means uses the second set of points whose distance from the reference coordinate point force is a value obtained by adding R and a predetermined margin r (r: a positive real number smaller than R). Set as the boundary of the range.
  • the recommendation means sets a point corresponding to a distance obtained by adding a margin r to R defining the first range as a boundary of the second range. It is possible to reduce the required processing load.
  • the value of the margin r is set to such a value when an optimal value can be predicted, estimated, or estimated in advance by a method such as experimental, empirical, or simulation. May be.
  • the value of margin r is set to a value of about 10% of R that defines the first range, the sensibility characteristic indicated by one search keyword can be used so that the music does not deviate significantly. While it is possible to make a recommendation, it is relatively preferable to reflect the user's sensitivity without omission.
  • the range setting means includes the reference described above among the plurality of songs in the n-dimensional coordinate system.
  • the distance from the coordinate point is within a first update range that is greater than R and less than or equal to the sum of R and margin r, or (ii) less than R and from R to the margin
  • the first range is updated based on the determination result by the determination means.
  • the range setting means determines the result of determination by the determination means only when a song having a distance of “R ⁇ r” from the reference coordinate point is recommended. Since the first range is updated based on this, it is possible to effectively reduce the update frequency of the first range and perform efficient music recommendation. For example, a song corresponding to the vicinity of a reference coordinate point is an answer that many users feel that it matches a single search keyword, and the viewing results of such a song are within the first range. The need for renewal is considered extremely low. In addition, since the vicinity of the center of the first range is subject to update, the basic music recommendation algorithm in the music recommendation device of the present invention may be affected, which is not practical. .
  • the range setting means recommends music existing in the first update range, and the recommended music matches the sensitivity of the user by the discrimination means. If it is determined that the first range is present, the first range may be updated in the direction of increasing.
  • the range setting means recommends a song that exists within the second update range, and determines that the recommended song does not match the sensitivity of the user by the discrimination means. The first range may be updated in the direction of decreasing.
  • the first range becomes large, and the music belonging to the second update range matches the user's sensibility. If this is not done, the first range will be small, and it will be possible to reflect the user's sensibility very effectively.
  • the range setting means includes (i) before and after the update is performed. R in the above, R and R, respectively (ii)
  • the first range can be constantly and effectively updated based on the above mathematical formula.
  • the value of the update coefficient ⁇ may be set to any value within the above range, but is determined to be optimal or optimal in advance, predicted, estimated, or estimated by a technique such as experimental, empirical, or simulation. If a value that can be inferred is known, it may be set to such a value. For example, set the update coefficient to about "0.05" In this case, it is preferable that both the convergence speed of the first range and the credibility of the first range can be secured relatively.
  • the characteristic items include a chord change rate, the number of beats per minute, the maximum beat amplitude, the average tone signal strength, and the maximum tone signal amplitude. Including at least one item.
  • the feature item may be any item as long as the emotional feature of the music can be expressed quantitatively or numerically. For example, as described here, the chord change If the feature item includes at least one of rate, beats per minute, maximum beat amplitude, average tone signal intensity, and maximum tone signal amplitude, the feature of the song is relatively well represented. It becomes possible.
  • chord change rate For example, if the chord change rate is relatively large, the possibility of a relatively lively song is high. If the chord change rate is relatively small, the possibility of a relatively quiet song is high. Yes. For example, if the number of beats per minute is relatively large, it is likely to be a relatively energetic or enjoyable song. If the number of beats per minute is relatively small, it is relatively relaxed. There is a high possibility that it is a powerful song. For example, if the maximum amplitude of the beat is relatively large, it is likely that the song is relatively intense. If the maximum amplitude of the beat is relatively small, the song may be relatively moderately powerful. High nature.
  • the music is likely to be relatively healthy. If the average tone signal intensity is relatively small, the song may be relatively quiet. High nature. Or, for example, if the maximum amplitude of the music signal is relatively large, the music signal is likely to be a relatively passionate song. If the maximum amplitude of the music signal is relatively small, the music is relatively dark. Is likely.
  • the music recommendation method of the present invention is quantified for each of n (where n is a natural number) feature items predetermined to represent the characteristics of a plurality of music pieces.
  • a range setting that sets a first range that defines a range that includes the n pieces of music feature values assigned to each of a plurality of search keys in an n-dimensional coordinate system having music feature values as n coordinate axes.
  • a desired search key ⁇ ⁇ ⁇ among the plurality of search keywords And when the desired search keyword is input in the input step, (i) the desired search keyword is selected from the plurality of songs in the n-dimensional coordinate system.
  • the effects of the music recommendation device of the present invention described above can be easily realized by the steps corresponding to the steps in the music recommendation device of the present invention described above. .
  • the music recommendation device of the present invention since the range setting means, the input means, the recommendation means, and the discrimination means are provided, it is possible to recommend appropriate music for each user. It becomes possible. According to the music recommendation method of the present invention, the range setting step, the input step, the recommendation step, and the discrimination step are provided, so that the effect exhibited by the music recommendation device can be easily realized.
  • FIG. 1 is a block diagram of an in-vehicle electronic device according to an embodiment of the present invention.
  • FIG. 2 is a schematic diagram of a music table stored in a memory in the in-vehicle electronic device of FIG.
  • FIG. 3 is a schematic diagram of a search table stored in a memory in the in-vehicle electronic device of FIG.
  • FIG. 4 is a schematic diagram of a search coordinate plane related to music recommendation processing.
  • FIG. 5 is a schematic diagram of a search coordinate plane on which music Mi related to music recommendation processing is arranged.
  • FIG. 6 is a flowchart of music recommendation processing.
  • FIG. 7 is another schematic diagram of a search coordinate plane related to music recommendation processing.
  • [0065] 10 Electronics for vehicle installation, 20 ... Bus line, 100 ... Navigation processing system, 200 ... Communication system, 210 "-MCU, 220 ... extraction unit, 230" CDZDVD drive, 240 ... Wireless communication device, 250 ... Display unit, 251 ... Display control unit, 252 ... Graphic controller, 253 ⁇ Noffer memory, 260... Input device, 270 “Memory, 280 ... Speech recognition processing unit, 290 ... Compression / decompression processing unit, 300 ... Audio processing system, 310 ... Hard disk device, 320 ... Sound output unit, 321 -DZA section, 322 ... variable amplifier, 323a, 323b ... speaker.
  • FIG. 1 is a block diagram of the in-vehicle electronic device 10.
  • an in-vehicle electronic device 10 is configured as an in-vehicle electronic device that integrates a vehicle-mounted audio unit and a navigation unit and further captures music data and a navigation map through a communication network.
  • a large number of music pieces for example, data compression music: MPEG-1 Audio Layer-3Z commonly known as MP3 are stored in advance in a hard disk device (HDD) by processing on the user side.
  • a large number of compressed music data downloaded from a music website on a communication network (especially the Internet) is stored on a node disk by a process on the user side.
  • the in-vehicle electronic device 10 includes a navigation processing system 100, a common processing system 200, and an audio processing system 300.
  • the navigation processing system 100 also includes a self-contained positioning device and a GPS receiver.
  • this type of in-vehicle electronic device 10 is provided with an input / output (I / O) circuit, an external interface (IZF) unit, and the like, which are not shown.
  • the common processing system 200 includes an MCU (Micro Controller Unit) 210, an extraction unit 220, a CD / DVD drive 230, a wireless communication device 240, a display unit 250, an input device 260, a memory 270, a voice recognition A recognition processing unit 280 and a compression / decompression processing unit 290.
  • MCU Micro Controller Unit
  • the audio processing system 300 is composed of a hard disk device (HDD) 310 and an audio output unit 320.
  • HDD hard disk device
  • the MCU 210 is a system controller that controls the entire apparatus, and executes a music recommendation process described later.
  • the MCU 210 includes a CPU 211, a ROM 212 that is a nonvolatile solid-state storage element, and a working RAM 213, and exchanges data with each unit connected to the bus line 20. Processing control by this exchange of data is executed by a boot program and a control program stored in the ROM 212.
  • the RAM 213 performs a working process for temporarily storing processing data of the CPU 211 by a user operation from the input device 260.
  • the CPU 211 functions as an example of each of the “range setting unit”, “recommendation unit”, and “discrimination unit” according to the present invention.
  • the extraction unit 220 is an example of the “extraction unit” according to the present invention.
  • the extraction unit 220 displays the characteristics of the played song as a feature item song. It can be extracted as a feature quantity. Characteristic items include, for example, at least part or all of items representing the rate of chord change, the number of beats per minute, the maximum beat amplitude, the average tone signal intensity, and the maximum tone signal amplitude. It refers to at least one index that can quantitatively express the emotional characteristics.
  • the feature items are assumed to be two types of feature item forces, “first feature item” and “second feature item”, in order to simplify the explanation.
  • the music feature amount extracted by the extraction unit 220 is stored as a music table in the memory 270 which is a rewritable recording medium. The music table will be described later.
  • the CDZDVD drive 230 is a common drive that reads music data, video data, text data, map data, and the like from the CD 231 or the DVD 232. Note that the CDZDVD drive 230 may be provided individually for each medium, or only one of them may be provided. However, do not install a large-capacity storage device such as the CDZDVD drive 230 when capturing music data, etc. by communication via the wireless communication device 240. It is also possible to do.
  • the hard disk device (HDD) 310 stores a large number of songs (compressed music data) as described above. That is, the user stores a large number of compressed music data obtained by downloading via the wireless communication device 240, for example.
  • the CDZDVD drive 230 stores a large number of music data read from the CD231 or DVD232.
  • the node disk device 310 stores music data, video data, text data, map data, and the like previously read by the CDZDVD drive 230 by user processing, and can be read at any time after this storage.
  • the audio data and video stored in the hard disk device 310 can be read and audio output and video output can be performed.
  • audio data, video data, map data, etc. downloaded by the wireless communication device 240 in advance by the user side processing are stored in the node disk device 310 and read out at an arbitrary time thereafter. Output is possible.
  • the wireless communication device 240 takes (receives) music data on a communication network into the hard disk device 310, and has the same configuration as a general-purpose mobile phone.
  • PDC Personal Digital and ellular Telecommunication System
  • PH3 ⁇ 4 Personal Handyphone System
  • TDMA Time Division Multiplexing unit
  • TDD Time Division Multiplexing unit
  • CDMA configuration high frequency radio transceiver, encoding / decoding unit, time division multiplexing unit, control unit, This is a configuration known as a voice input / output unit or the like.
  • the display unit 250 displays various processing data on the screen under the control of the MCU 210.
  • the display unit 250 controls each unit of the display control unit 251 based on control data transferred from the CPU 211 through the internal graphic controller 252 power bus line 20.
  • a buffer memory 253 using V-RAM or the like temporarily stores displayable image information.
  • the display control unit 251 performs display control.
  • the image data output from the display 254 force graphic controller 252 constituted by a liquid crystal display (LCD), an EL (Electro-Luminescence) display, or a cathode ray tube (CRT) is displayed on the screen.
  • This The display 254 is disposed, for example, in the vicinity of the front panel in the vehicle.
  • an internal DZA converter 321 converts a digital audio signal into an audio analog signal under the control of the MCU 210, and a variable amplifier (AMP) 322 variably amplifies the input operation by a user. Output to speakers 323a and 323b.
  • AMP variable amplifier
  • the input device 260 is an example of the "input means" according to the present invention, which includes various keys, button switches, remote controllers, and the like for inputting various commands and data.
  • the voice recognition processing unit 280 is composed of a digital signal processor (DSP) or the like, and transfers various commands and data identifying the voice signal of the voice input operation (for example, music playback instruction input) to the MCU 210. To do.
  • music playback on / off, music selection input instructions, and music playback skip instructions on or after music selection list can be performed by voice recognition (eg, linear prediction spectrum analysis). It has been.
  • the compression / decompression processing unit 290 is configured by a digital signal processor (DSP) or the like, compresses music data when stored in the audio disk device 310, and decompresses (demodulates, for example, the above-described data). MPEG-1 method).
  • DSP digital signal processor
  • the speech recognition processing unit 280 and the compression / decompression processing unit 290 are not configured with a digital signal processor (DSP) or the like, but are installed with dedicated utility software, and this software (program) is loaded into the MCU 210. May be executed to perform the same processing.
  • DSP digital signal processor
  • FIG. 2 is a schematic diagram of the music table 271
  • FIG. 3 is a schematic diagram of the search table 272.
  • the memory 270 may be configured to function as an example of each of the “first storage unit” and the “second storage unit” according to the present invention.
  • the music table 271 is a music feature amount in the first feature item and the second feature item by the extraction unit 220 among the plurality of songs stored in the hard disk device 310.
  • the music feature amount in the first feature item is "0.1"
  • the second feature item The music feature amount in is given as “0.5”.
  • these music feature values are music feature values as a result of normalization processing performed by the MCU 210 on each music feature value extracted by the extraction unit 220. That is, in the present embodiment, real values from 0 to 1 are assigned to the music feature quantities of the feature items.
  • the search table 272 includes a plurality of preset search keywords Ki.
  • This is an updatable LUT in which the music feature quantity of the feature item is assigned to (i l, 2, ⁇ , n) in the same way as the music table 271.
  • this music feature amount is not extracted by the extraction unit 220 but is stored in advance in the ROM 212 in the MCU 210 as a fixed value. That is, the MCU 210 reads these music feature quantities from the ROM 212 and stores them in the memory 2.
  • a search table 272 is generated on 70.
  • Search keywords are words that indicate the sensual features of a song, such as “fun”, “energetic”, “lively”, “good”, and the song features of each feature item assigned to these search keywords.
  • the amount is a music feature amount most applicable to the emotional feature represented by these search keywords.
  • the music feature amount assigned to these search keywords is given an optimum value in advance by a technique such as experimental, empirical, or simulation.
  • FIG. 4 is a schematic diagram of the search coordinate plane.
  • the search coordinate plane is a coordinate plane having two types of feature items as the vertical axis and the horizontal axis, and the music feature amount in each corresponds to the coordinate value.
  • the search coordinate plane is an example of an “n-dimensional coordinate system” according to the present invention.
  • each search keyword can be arranged at a coordinate point corresponding to the music feature amount assigned to each search keyword.
  • the coordinate point corresponding to each search keyword is an example of the “reference coordinate point” according to the present invention.
  • the coordinate values on the horizontal axis and the vertical axis are 0 respectively.
  • the coordinate points corresponding to 5 and 0.6 are the reference coordinate points.
  • This reference coordinate point is the coordinate point that most appropriately indicates the sensibility feature indicated by each search keyword in the search coordinate plane, but the area around this reference coordinate point is equally sensitive. Fit for features It is clear visually that this is considered.
  • a circle centered on the reference coordinate point in each search keyword Ki is defined, and a range corresponding to the circle is a range that matches the search keyword Ki. That is, the circle set for each search keyword Ki is a “match range” as an example of the “first range” according to the present invention. “Radius R” stored in the search table 272 represents the radius of this matching range.
  • the radius R of the matching range is set to be updatable on the search table 272, and its initial value is stored in the ROM 212 when the vehicle-mounted electronic device 10 is shipped from the factory, for example.
  • the MCU 210 When the MCU 210 generates the search table 272, the MCU 210 reads the initial value from the ROM 212 and generates the initial search table 272.
  • the search table 272 in FIG. 3 indicates that “0.2” is given as an initial value.
  • FIG. 5 is a schematic diagram of a search coordinate plane on which the music piece Mi is arranged.
  • the music piece Mi is arranged at the coordinate point corresponding to the music feature amount extracted by the extraction unit 220.
  • the music Mn belongs to the matching range (radius Rn is the initial value) corresponding to the search keyword Kn.
  • the music M3 belongs to the matching range corresponding to the search keyword K1
  • the music M2 belongs to the matching range corresponding to the search keyword K3.
  • the matching range corresponding to the search keyword K2 does not include any music.
  • the music Ml is not included in the matching range corresponding to any search keyword.
  • the music pieces that belong to the matching range are treated as music pieces that match the search keyword.
  • the search keyword Kn is a keyword “fun music”, it means that the music Mn is a fun music.
  • FIG. 6 is a flowchart of the music recommendation process realized by the MCU 210 executing the music recommendation program stored in the ROM 212. Note that Figure 6 It is assumed that the search keyword Kn is input via the input device 260!
  • the CPU 211 refers to the music table 27 1 and the search table 272 stored in the memory 270 and selects “recommended range” from the music stored in the hard disk device 310.
  • the music data is supplied to the audio output unit 320.
  • This music is processed by the audio output unit 320 and emitted from the speakers 323a and 323b (step S10). At this point, the user views this music piece.
  • a range in which the radius is further expanded by the margin r is a “recommended range” as an example of the “second range” according to the present invention.
  • the value of the margin r is set to a value corresponding to 10% of the radius R of the matching range.
  • the radius R of the mate range is the initial value “0.2”, so in FIG. 7, the margin r is set to “0.02”, and the recommended range is centered on the reference coordinate point.
  • the corresponding range is within the circle with a radius of 0.22.
  • the recommended range includes a matching range and is larger than the matching range
  • songs that are considered not to match the search keyword Kn are included because of the concept of the search coordinate plane.
  • the music Mn5 is included in the power recommendation range, which is a music that does not match the search keyword Kn, the CPU 211 recognizes this music Mn5 as a selection target.
  • the CPU 211 sequentially selects and plays music pieces belonging to the recommended range. Note that the CPU 211 does not always need to select and play music from the recommended range when one search keyword is input from the user. For example, normally, music may be selected and played from music belonging to the matching range, and music belonging to the recommended range may be selected and played at an appropriate timing.
  • step S11 The user evaluates the reproduced music by his / her own judgment, and feeds it back to the CPU 211 via the input device 260 or the voice recognition processing unit 280 (step S11).
  • This feedback For example, when the user determines that the song does not match the search keyword Kn, the user selects and inputs a button switch indicating “non-match”. Or, if you decide that this song does not match the search keyword Kn, you can say “Skip”. If there is no positive feedback from the user, the CPU 211 determines that this song matches the user's sensitivity. Therefore, in step S11, “feedback” does not necessarily indicate an active response of the user side, but the process related to the music recommendation process continues. The feedback result by the user is temporarily stored in the RAM 213 regardless of whether it is active or inactive.
  • the CPU 211 determines whether or not the music being played is a music within the first update range (step S12). If the music is not within the first update range (step S12: NO), the CPU 211 further determines whether or not the music being played is a music within the second update range (step S15).
  • the first update range refers to the range defined by “R ⁇ S ⁇ R + r”, where S is the distance of the reference coordinate point force.
  • the second update range refers to the range defined by the distance force “R — r ⁇ S ⁇ R” from the reference coordinate point.
  • the music belonging to the first update range is music Mn5
  • the music belonging to the second update range is music Mn4.
  • the matching range corresponding to the search keyword input reflecting the user's sensitivity is updated.
  • step S12 when the music being played is within the first update range (step S12: YES), the CPU 211 obtains the user feedback result from the RAM 213, and this music matches the user's sensitivity. It is determined whether or not the force is present (step S13). At this time, if the user feedback result is not stored in the RAM 213, the CPU 211 stops the process until the result is stored. The time when the CPU 211 determines that the music being played matches the user's sensibility may be set to any time.
  • step S13 If the music being played matches the user's sensibility (step S13: YES), the CPU 211 updates the matching range corresponding to the search keyword Kn in the enlargement direction (step S14). In other words, the radius R of the matching range is updated so as to increase.
  • the CPU 211 updates the value of the radius R according to the following formula (1).
  • the updated match range more specifically, the updated radius R value is stored in the search table 272 as the latest radius R for the search key Kn.
  • Rn is the value of radius R at the time of the n ⁇ first update
  • Rn + 1 is the value of radius R after the nth update
  • is an update coefficient, which is defined in a range of “0 ⁇ ⁇ 1,” and is set to “0. 05” in the present embodiment.
  • D represents the distance to the music being played in the reference coordinate point force on the search coordinate plane (see Fig. 7). For example, if the music being played is the music Mn5 in FIG. 7, and if this music matches the user's sensitivity, the matching range for the search keyword Kn is updated according to the above equation.
  • step S13 NO
  • the CPU 211 returns to step S10 without updating the matching range, and the next music Start playback.
  • the reason why the update is not performed is that the song Mn5 is originally a song that does not match the search keyword Kn, so if the user determines that it does not match, the match range corresponding to this search keyword Kn is correct. Yes, there is no need for renewal.
  • step S12 when the music being played does not belong to the first update range (step S12: NO), the process related to step S15 is performed. If the song being played is within the second update range (step S15: YES), the CPU 211 obtains the user feedback result from the RAM 213, and whether or not this song does not match the user's sensitivity. Is determined (step S16). This At this point, if the user feedback result is stored in the RAM 213, the CPU 211 stops the process until the result is stored as in step S13.
  • step S16 If the music being played does not match the user's sensibility (step S16: YES), the CPU 211 updates the matching range corresponding to the search keyword Kn in the reduction direction (step S17). Also at this time, the matching range is updated based on the above equation (1). For example, if the music being played is the music Mn4 in FIG. 7, and if this music does not match the user's sensitivity, the matching range for the search keyword Kn is updated according to the above formula.
  • step S16 If the music being played matches the user's sensibility (step S16: NO), the CPU 211 does not update the matching range corresponding to the search keyword Kn and proceeds to step S10. Go back and start playing the next song.
  • step S15 If the music being played is not within the second update range (step S15: NO), the matching range is not updated, and the process proceeds to step S10.
  • the music being played is the music Mnl, Mn2, or Mn3
  • the distance from the reference coordinate point is smaller than “R ⁇ r”, so that the user feedback indicates The mate range is not updated.
  • the matching range is updated, or the power of the music being played does not belong to the first and second update ranges, and the music being played is within the first update range. If the music that does not match the user's sensibility, or the song being played is within the second update range and matches the user's sensibility, the process related to the currently playing song ends. Then, the CPU 211 returns the process to step S10 and starts playing the music having the next playing order.
  • the in-vehicle electronic device 10 is configured to be able to update the matching range for the search keyword as described above. Therefore, different sensibility can be reflected for each user, and appropriate music can be recommended for each user.
  • the matching range is determined based on the initial value
  • the music Mn6 and Mn7 are outside the recommended range, and the device is used when the search keyword Kn is input.
  • the music is not recommended by the side.
  • One user can search If the keyword Kn has a wide sensitivity, that is, if the user feels that most songs match the search keyword ⁇ , the matching range update process based on the above equation (1) During several updates, these songs may fall within the recommended range. Conversely, if another user has a narrow sensitivity to the search keyword ⁇ , that is, if the user feels that most of the songs do not match the search keyword ⁇ , it will be updated several times. Sometimes the music Mnl, ⁇ 2 and ⁇ 3 may leak the recommended range power. Therefore, even if the initial state is the same, the sensitivity of each user is sufficiently reflected as time passes.
  • the coordinate system according to the present invention can also adopt a three-dimensional coordinate space, a multidimensional coordinate space, or a one-dimensional coordinate axis.
  • the matching range is set as a circle centered on the reference coordinate point.
  • the shape of the force matching range can be determined to match the emotional characteristics indicated by the search keyword. Any shape can be used as long as it is within the range. For example, it may be oval.
  • the music recommendation apparatus and method according to the present invention can be used for, for example, car audio and stereo that can provide music according to the user's sensitivity from among a large number of music.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 ユーザが入力する検索キーワードに合致した楽曲を推薦する場合、CPU211は、検索座標平面上において、合致範囲を含んだ推薦範囲から楽曲の推薦を行い、順次再生する。第1更新範囲又は第2更新範囲に属する楽曲が再生されている場合にのみ、ユーザによるフィードバックに基づいて合致範囲が更新される。第1更新範囲に属する楽曲がユーザの感性に合致している場合には合致範囲は拡大する方向に、また、第2更新範囲に属する楽曲がユーザの感性に非合致である場合には、合致範囲は縮小する方向に夫々更新される。更新された合致範囲は、検索テーブル272に保管される。

Description

明 細 書
楽曲推薦装置及び方法
技術分野
[0001] 本発明は、例えば多数の楽曲の中からユーザの感性に応じた楽曲を提供可能な力 一オーディオ、ステレオなどで用いられる、楽曲推薦装置及び方法の技術分野に関 する。
背景技術
[0002] 例えば複数の楽曲の中から、ユーザが指定する特徴をもった楽曲を検索することが 可能な装置が提案されている (例えば、特許文献 1参照)。
[0003] 特許文献 1に記載された情報選択再生装置 (以下、「従来の技術」と称する)によれ ば、楽曲などのコンテンツを検索するための検索キーワード (例えば、陽気な曲、スカ ッとする曲、聞力せる曲など)と、それらコンテンツの特徴を表す特徴ワード (例えば、 明るさ、暗さ、楽しさ、元気、ノリの良さなど)との相関値を含むと共に更新可能な感性 テーブル、及び各特徴ワードに係る特徴の有無が記された特徴ワードリストが用意さ れる。ユーザが所望の検索キーワードを入力すると、これに合致するコンテンツが感 性テーブル及び特徴ワードリストを基準に選択される。
[0004] この際、選択された楽曲など力 例えばユーザによってスキップされたか否かによつ て、ユーザの感性における特徴が定量的に抽出され、感性テーブルの相関値が更 新される。このように感性テーブルがユーザの感性を反映して更新されることによって 、個人の感性に対応したコンテンツの選択が可能であるとされている。
[0005] 特許文献 1 :特開 2003— 132085号公報
発明の開示
発明が解決しょうとする課題
[0006] し力しながら、上述した従来の技術は、以下に示す問題点を有する。
[0007] 即ち、ユーザが入力した検索キーワードに合致するコンテンツを検索する際、従来 の技術においては、ユーザの別なぐ常に入力された検索キーワードからの定量ィ匕さ れた距離が等しい範囲内にあるコンテンツが検索結果として提供される。本来、人間 の感性は個人差があり、例えば、「陽気な曲」と言ってイメージされる楽曲の範囲も千 差万別である。従って、膨大なコンテンツの中から、ユーザ個人の感性に合致した範 囲のコンテンツを検索し提示することは、従来の技術では極めて困難である。
[0008] 本発明は上述した問題点に鑑みてなされたものであり、ユーザ毎に適切な楽曲の 推薦を行うことが可能な楽曲推薦装置及び方法を提供することを課題とする。
課題を解決するための手段
[0009] <楽曲推薦装置 >
本発明の楽曲推薦装置は上記課題を解決するために、複数の楽曲各々の特徴を 表すために予め定められた n (但し、 nは自然数)種類の特徴項目毎に定量化された n個の楽曲特徴量を n本の座標軸とする n次元座標系において、複数の検索キーヮ ード各々に付与された前記 n個の楽曲特徴量を包含する範囲を規定する第 1の範囲 を設定する範囲設定手段と、前記複数の検索キーワードのうち、所望の検索キーヮ ードを入力可能な入力手段と、前記入力手段を介して前記所望の検索キーワードが 入力された場合に、前記複数の楽曲の中から、前記 n次元座標系において (i)前記 所望の検索キーワードに対応する第 1の範囲又は、 (ii)前記第 1の範囲を含む第 2の 範囲に属する、前記 n個の楽曲特徴量を有する一又は複数の楽曲を検索してユー ザに推薦する推薦手段と、前記推薦された楽曲が前記ユーザの感性に合致している か否かを判別する判別手段とを具備し、前記範囲設定手段は、前記判別手段による 判別結果に基づいて、前記所望の検索キーワードに対応する第 1の範囲を更新する
[0010] 本発明の楽曲推薦装置によれば、範囲設定手段によって、複数の楽曲各々の特 徴を表すために予め定められた n種類の特徴項目毎に定量ィ匕された n個の楽曲特徴 量を n本の座標軸とする n次元座標系において、複数の検索キーワード各々に付与 された前記 n個の楽曲特徴量を包含する範囲を規定する第 1の範囲が設定される。
[0011] 本発明において、「楽曲」とは、ロック、ポップス、演歌、ジャズ又はクラシックなど、そ のジャンルを問わず、ユーザによって視聴され得る音楽及び音楽情報全てを含む概 念である。尚、このような楽曲が視聴される場所は、自動車などの移動体内、自宅や 会社などの室内、又は屋外など何ら限定されない。また、このような視聴場所に対応 して、視聴時の状況も、自動車などの移動体の移動中又は停止中、仕事中、勉強中 、徒歩による移動中など諸形態を採り得る。
[0012] 従って、本発明の楽曲推薦装置も、オーディオ機器、車載用オーディオ機器、カー ナビゲーシヨン装置、又は携帯用音楽機器などの一部若しくは全体、又はそれらに 機能を付加する外付けの機能拡張装置など多様な形態を採り得る。
[0013] 本発明の楽曲推薦装置において、これら楽曲は、例えば、 CDや DVDなどに予め 記録された市販の音楽ソフトウェアに含まれる楽曲であってもよいし、インターネットな どのネットワークを介して、ユーザが所定のサーバなど力もダウンロードした、或いは 所定のサーノから配信された楽曲であってもよ 、。このようにダウンロード或いは配 信されるなどしてユーザが取得した楽曲である場合には、これら楽曲は、ユーザ側に おいて、適宜 HD (Hard Disk) , CD-ROM, CD-RW, DVD— ROMゝ又は DVD RAMなどの記録媒体に記録されて保存されて 、てもよ 、。
[0014] 本発明において「特徴項目」とは、これら複数の楽曲を感性的に分類するために予 め n個用意されたパラメータである。ここで、「感性的に分類する」とは、例えば、「楽し い」、「明るい」、「元気が良い」、「暗い」、「静か」、「ノリが良い」などのように、人間の 感性に属するカテゴリに楽曲を分類することを指す。そのために、本発明における特 徴項目は、これら感性的な分類を可能とする、例えば、「リズム」、「ビート」、又は「音 高」など、楽曲の性質を物理的な数値として置換可能な項目力もなる。例えば「リズム 」を例にとれば、リズムの遅い曲は総じて「静かな曲」であることが多ぐ「元気な曲」で あることは少ない。このように、感性的な分類項目と何らかの相関関係を有する定量 化可能な項目の全てが、本発明における「特徴項目」となり得る。
[0015] ここで、「第 1の範囲」とは、 n種類の特徴項目毎に定量化された n個の楽曲特徴量 を n本の座標軸とする n次元座標系において、複数の検索キーワード各々に付与さ れた n個の楽曲特徴量を包含する範囲を規定する範囲である。 nは自然数であるから 、本発明において係る座標系は、座標軸、 2次元座標平面、又は多次元次元座標空 間などの諸形態を採り得る。尚、ここで、「n個の楽曲特徴量を n本の座標軸とする」と は、即ち、 n個の特徴項目を座標軸の項目とすることを意味する。
[0016] 尚、係る座標系における座標値は、楽曲特徴量そのものであってもよいし、楽曲特 徴量から生成又は算出される値であってもよぐ楽曲特徴量を正規ィ匕した値であって もよい。正規化される場合には、一の座標軸に係る座標値の差分が、複数の座標軸 (即ち、楽曲特徴量)間で相互に同程度の特徴の重み付けとなるように正規化されて いてもよい。
[0017] 本発明において、「検索キーワード」とは、ユーザ側において所望の楽曲を選択す るために使用されるフレーズであり、例えば、「楽しい」、「明るい」、「暗い」、「元気が 良い」、又は「ノリが良い」などのフレーズを指す。即ち、検索キーワードとは、前述し た如き「感性的」に分類された楽曲を検索するための所謂「感性語」とも称される概念 である。本発明において、この検索キーワードには、夫々楽曲と同様に特徴項目に おける楽曲特徴量が付与されている。
[0018] 第 1の範囲とは、これら検索キーワード各々に付与された n個の楽曲特徴量を包含 する範囲を規定する範囲である。ここで述べられる「包含する範囲」とは、 n次元座標 系において、検索キーワード各々に付与された楽曲特徴量に真に対応する座標点 を含む適当な範囲を指すが、例えば、検索キーワードが示す感性的な特徴から外れ ていないと考えられる程度の範囲であるのが好適である。尚、これ以降、検索キーヮ ードによって示される感性的な特徴力 外れていないこと、適宜「検索キーワードに 合致して 、る」などと表現することとする。
[0019] 例えば、二つの特徴項目によって楽曲が特徴付けられている場合、座標系は 2次 元座標平面で表されるが、一の検索キーワードに設定される第 1の範囲は、係る検索 キーワードに付与された楽曲特徴量に対応した円形の範囲であってもよい。また、夫 々の座標軸が表す特徴項目の重み付けが相互に異なる場合などには楕円形の範 囲であってもよい。或いは、単純に、夫々の座標軸において許容される座標点の範 囲を重ね合わせた四角形の範囲であってもよい。また、単に初期値としての第 1の範 囲を適当に定めた結果としての適当な範囲であってもよい。
[0020] このように範囲設定手段によって検索キーワード各々につ 、て第 1の範囲が設定さ れている状態において、本発明の楽曲推薦装置においては、入力手段によって、そ れら検索キーワードのうち所望のものが入力される。例えば、「楽しい」といった検索 キーワードが入力される。このような入力を可能とする入力手段は、例えば、キーボー ド、マウス、スクロールボタン、各種ボタン、又はタツチパネル装置など各種形態を採り 得るが、ユーザが視聴を所望する楽曲を検索するために検索キーワードを入力可能 な限りにおいて、その態様は自由である。
[0021] 検索キーワードが入力されると、推薦手段により、複数の楽曲の中から、 n次元座標 系において入力された検索キーワードに対応する第 1の範囲、又は係る第 1の範囲 を含む第 2の範囲に属する、 n個の楽曲特徴量を有する一又は複数の楽曲が検索さ れ、ユーザに推薦される。
[0022] 例えば、「楽しい」という検索キーワードが入力された場合には、この検索キーワード に設定された第 1の範囲に属する楽曲特徴量を有する楽曲が検索され、ユーザに対 し「楽し 、」楽曲として推薦される。
[0023] ここで特に、第 1の範囲が不変である場合、常に固定範囲に属する楽曲が推薦され ることとなって、従来の問題点として述べたように、ユーザ個々の感性を十分に反映 することが困難となる。
[0024] そこで、本発明の楽曲推薦装置においては、以下の如くにして、ユーザの感性を反 映させた楽曲推薦を実現している。即ち、ユーザによって所望の検索キーワードが入 力された場合、上述した第 1の範囲か、又はこの第 1の範囲を含む更に広い第 2の範 囲に属する楽曲が「楽しい」楽曲として推薦される。ここで、「第 2の範囲」とは、第 1の 範囲を含んでなる範囲である。
[0025] この第 2の範囲内であって、第 1の範囲外となる範囲に属する楽曲は、本来、入力さ れた検索キーワード (例えば「楽しい」)には合致しないと考えられる楽曲である力 こ の場合、「合致しない」とは、あくまで設定された特徴項目の楽曲特徴量からみて、係 る検索キーワードが示す感性的な特徴から外れて 、る可能性が高 、ことを表すに過 ぎない。従って、ユーザによっては、この第 1の範囲外に存在する楽曲を、入力した 検索キーワードに合致する楽曲であると感じる可能性が十分にあるのである。
[0026] この第 2の範囲は、第 1の範囲、即ち、検索キーワードに付与された楽曲特徴量を 包含する範囲 (好適には検索キーワードに合致すると考えられる範囲)を含む限りに おいてどのように設定されてもよいが、例えば、明らかに第 1の範囲によって表される 特性から乖離した範囲の楽曲を推薦すると、装置側の負荷が増加して効率的な楽曲 推薦が困難となる可能性がある。このような場合には、第 2の範囲は、経験的、実験 的、或いはシミュレーションなどの手法により予め適切な範囲に定められていてもよい
[0027] 尚、推薦手段が、係る第 1及び第 2の範囲のうちいずれの範囲をユーザに推薦する 範囲として使用するかは、自由に設定されてよい。例えば、第 1の範囲複数回に対し 1回の割合で第 2の範囲に属する楽曲が推薦されてもよい。またはその逆であっても よい。或いは、ユーザ側の選択動作によって、第 2の範囲に属する楽曲を推薦するよ うに促された場合に限って第 2の範囲に属する楽曲が推薦されてもよい。
[0028] 一方、このようにして推薦された一又は複数の楽曲は、例えばユーザが逐次推薦リ ストから選択するか、又は自動的に適当な順番で演奏が開始されるなどしてユーザ に視聴される。ここで、楽曲が「視聴」されるとは、例えば、液晶ディスプレイパネルな ど力もなる情報表示パネルに、演奏が開始される楽曲の楽曲名、アーティスト名、又 は演奏時間などが視覚的に表示される場合も含んだ概念である。
[0029] このように、ユーザによる視聴が開始された楽曲は、判別手段によって、ユーザの 感性に合致している力否かが判別される。ここで、「感性に合致している」とは、即ち、 検索キーワードとして入力した感性要素 (例えば、「楽しい」)と、この楽曲から実際に ユーザが受ける感性要素が一致して 、ることを指す。
[0030] 判別手段によるこのような判別は、例えば、ユーザが最後までその楽曲を聴いたか 否かに基づいて行われる。この際、最後まで聴かれた (再生された)場合には、ユー ザは入力した検索キーワードと合致した曲であると判断したと判別することが可能で ある。一方で、演奏開始直後や、演奏中などに演奏が中止されたり、スキップされたり した場合には、合致していないと判断することも可能である。また、このような楽曲の 再生状況と関係なぐユーザが自身の感性に合致している力を装置側に伝達するた めの専用のボタンなどが予め用意されていてもよい。また、この場合、ボタンは、本発 明の入力手段と共通に構成されていてもよい。また、ユーザによって演奏中の楽曲が スキップされたとしても、ユーザは実際に入力した検索キーワードに合致していると感 じており、単にその時点の気分によってその楽曲の演奏を好まな力つたといった場合 が存在する。このような状況を考慮しない場合には、ユーザの感性を誤って勉強して しまう可能性があるから、ユーザによる楽曲のスキップは判別手段による判別対象か ら除外してもよい。
[0031] 範囲設定手段は、この判別手段による判別の結果に基づいて、入力された検索キ 一ワードに対応する第 1の範囲を更新する。より具体的には、例えば、第 2の範囲内 であって第 1の範囲外である範囲に属する楽曲が最後まで視聴された場合には、こ の検索キーワードに対応する第 1の範囲が大きくなるように更新する。また、第 1の範 囲内であっても、その境界付近に属する楽曲がユーザによって拒否された場合には 、この検索キーワードに対応する第 1の範囲が小さくなるように更新する。尚、更新の 態様は、ここに例示したものに限定されず、推薦した楽曲がユーザの感性に合致して いる力否かの判別に基づいて、よりユーザの感性に近付くように第 1の範囲を更新す る限りにおいて、どのように更新されてもよい。
[0032] 以上説明したように、本発明の楽曲推薦装置によれば、検索キーワード各々に対し 設定される第 1の範囲を、ユーザの感性を反映して更新することが可能となる。また、 この更新は、第 1の範囲をより広げる方向及び狭める方向に、言わば双方向的に行う ことが可能であるから、ユーザ毎に適切な楽曲の推薦を行うことが可能となるのである
[0033] 本発明の楽曲推薦装置の一の態様では、前記複数の楽曲各々について、前記 n 個の楽曲特徴量を抽出する抽出手段と、前記抽出された楽曲特徴量を、前記複数 の楽曲各々に対応付けて記憶する第 1記憶手段とを更に具備する。
[0034] この態様によれば、抽出手段により、複数の楽曲各々について楽曲特徴量が抽出 されると共に、抽出された楽曲特徴量が、複数の楽曲各々に対応付けられて第 1記 憶手段に記憶される。従って、ユーザ側で用意する楽曲が経時的に増加しても、そ の都度適当なタイミングで楽曲特徴量を抽出し、記憶しておくことが可能となって便 利である。
[0035] 尚、この際、例えば、楽曲情報と抽出された楽曲特徴量が相互に対応付けられて 格納されてなる楽曲テーブルが作成され、この楽曲テーブルが記憶されていてもよ い。この場合、楽曲情報とは、楽曲を演奏するための楽音データ、若しくはこの楽音 データの格納場所の情報、楽曲名、又はアーティスト名などを含んでいてもよい。 [0036] 尚、第 1の記憶手段とは、本発明に係る楽曲推薦装置が、大容量の HDDなど予め 所定の記録媒体の中から楽曲を推薦するように構成されている場合には、このような 楽曲を格納する記録媒体そのものであってもよい。その際は、この記録媒体に格納さ れる楽曲の楽音データなどに付帯させる形で、これら抽出された楽曲特徴量が、後 々参照可能な形式で記憶されて 、てもよ 、。
[0037] 本発明の楽曲推薦装置の他の態様では、前記設定された第 1の範囲を、前記複数 の検索キーワード各々に対応付けて格納する第 2記憶手段を更に具備し、前記範囲 設定手段は、前記第 2記憶手段に格納された前記第 1の範囲を更新する。
[0038] この態様によれば、範囲設定手段によって設定された第 1の範囲が検索キーワード 各々に対応付けられる形で第 2記憶手段に記憶されるので、ユーザ毎に最新の更新 結果を反映すると共に常に参照することも可能となって大変便利である。
[0039] この際、例えば、検索キーワード名、付与される楽曲特徴量の情報、及び第 1の範 囲を規定する情報などが格納されてなる検索テーブルが作成され、記憶されて 、て もよい。また、第 2記憶手段は、前述の第 1記憶手段と同一のハードウェアとして構成 されていてもよいし、異なるハードウェアとして構成されていてもよい。また、一部が相 互に共通のハードウェアとして構成されて 、てもよ 、。
[0040] 本発明の楽曲推薦装置の一の態様では、前記判別手段は、前記ユーザの個別判 断に基づいて、前記推薦された楽曲が前記ユーザの感性に合致している力否かを 判別する。
[0041] この態様によれば、判別手段がユーザの個別判断に基づいて、推薦手段によって 推薦された楽曲がユーザの感性に合致しているか否かを判別することが可能となる ので、ユーザの感性を高い信憑性をもって反映させることが可能となる。このようなュ 一ザの個別判断は、例えば、「合致」又は「非合致」を表す専用のボタンやキーなどを 介して判別手段に供給されてもよい。或いは、公知である音声認識技術などを用い て判別手段に供給されてもょ ヽ。
[0042] 本発明の楽曲推薦装置の他の態様では、前記範囲設定手段は、前記 n次元座標 系において、前記所望の検索キーワードに付与された楽曲特徴量によって規定され る基準座標点力もの距離が R(R:正の実数)である点の集合を、前記第 1の範囲の境 界として設定する。
[0043] この態様によれば、第 1の範囲の境界が、範囲設定手段によって、前述の座標系に おける基準座標点カゝら等距離にある座標点の集合として設定される。
[0044] ここで、「基準座標点」とは、 n次元座標系にお 、て、検索キーワード各々につ!/、て 、付与された楽曲特徴量によって一意に定まる座標点を指す。従って、この基準座 標点は、検索キーワードによって表される感性的な特徴を、座標系内において最も 高い確率で表している。
[0045] ここで、「基準座標点から等距離」とは、例えば、 2次元座標系であれば、基準座標 点を中心とした円の外周であり、その場合の第 1の範囲とは、即ち係る円内を指す。 また、 3次元座標系であれば、基準座標点を中心とした球の外周面であり、その場合 の第 1の範囲とは、即ち係る球内を指す。また、この態様においては、範囲設定手段 の上述した如き更新動作によって、この第 1の範囲を規定する「R」の値力 ユーザの 感性を反映して変化することとなる。尚、係る Rの初期値は、例えば、予め実験的、経 験的、或いはシミュレーションなどの手法により最適な値が事前に予測、推測、又は 類推可能である場合には、そのような値に設定されて 、てもよ 、。
[0046] この態様によれば、第 1の範囲を設定する処理に要する負荷は比較的にみて軽く 済むとともに、一の検索キーワードに対応する基準座標点が第 1の範囲の中心に設 定されるから、第 1の範囲を、全ての特徴項目をバランスよく考慮した範囲に設定す ることが可能となる。
[0047] 本発明の楽曲推薦装置の他の態様では、前記推薦手段は、前記第 2の範囲を、前 記 n次元座標系にお 、て前記第 1の範囲を所定の割合で拡大した範囲に設定する。
[0048] この態様によれば、推薦手段が、第 2の範囲を、第 1の範囲を所定の割合で拡大し た範囲として設定するので、楽曲推薦に要する処理負荷を軽減することが可能であ る。また、この場合、第 1の範囲が比較的に複雑な形状を有していても、第 1の範囲に よって表される、一の検索キーワードにおける各種特徴項目の比率及びバランスを 維持したまま、第 2の範囲を設定することも容易にして可能であり、効果的に楽曲を 推薦することが可能となる。
[0049] Rによって第 1の範囲が規定される本発明の楽曲推薦装置の一の態様では、前記 推薦手段は、前記基準座標点力ゝらの距離が、前記 Rと所定のマージン r (r:Rよりも小 さい正の実数)とを加算した値となる点の集合を、前記第 2の範囲の境界として設定 する。
[0050] この態様によれば、推薦手段が、第 1の範囲を規定する Rに対し、更にマージン rを 付加した距離に相当する点を第 2の範囲の境界として設定するので、楽曲推薦に要 する処理負荷を軽減することが可能である。この場合、マージン rの値は、実験的、経 験的、或いはシミュレーションなどの手法により、予め最適な値が予測、推測、又は類 推可能である場合には、そのような値に設定されていてもよい。例えば、マージン rの 値力 第 1の範囲を規定する Rの 10%程度の値に設定されている場合には、一の検 索キーワードによって示される感性的な特徴力 大きく逸脱しない程度に楽曲を推薦 することを可能としつつ、ユーザの感性を漏れなく反映することが比較的に可能とな るので好適である。
[0051] マージン rによって第 2の範囲が規定される本発明の楽曲推薦装置の一の態様で は、前記範囲設定手段は、前記 n次元座標系において、前記複数の楽曲のうち、前 記基準座標点からの距離が、 ( 前記 Rよりも大きく且つ前記 Rと前記マージン rとを加 算した値以下となる第 1更新範囲内、又は (ii)前記 Rよりも小さく且つ前記 Rから前記 マージン rを減算した値以上となる第 2更新範囲内、に存在する楽曲が推薦された場 合に、前記判別手段による判別結果に基づいて前記第 1の範囲を更新する。
[0052] この態様によれば、座標系において、基準座標点からの距離が「R±r」の範囲に存 在する楽曲が推薦された場合にのみ、範囲設定手段が判別手段による判別結果に 基づいて第 1の範囲を更新するので、第 1の範囲の更新頻度を効果的に低減し、効 率的な楽曲推薦を行うことが可能となる。例えば、基準座標点近傍に相当する楽曲 は、比較的にみて、一の検索キーワードに合致していると感じるユーザが多い答であ り、このような楽曲の視聴結果までを第 1の範囲の更新対象とする必要性は極めて低 いと考えられる。また、この第 1の範囲の中心付近を更新の対象としてしまうことによつ て、本発明の楽曲推薦装置における基本的な楽曲推薦アルゴリズムに影響を与えて しまう可能性があり実用的でな 、。
[0053] 従って、このように第 1の範囲の外縁付近に相当する楽曲が視聴された結果のみを 、第 1の範囲の更新に反映させることによって、一の検索キーワードに合致する楽曲 を推薦すると ヽぅ基本的なアルゴリズムを維持したまま、ユーザの感性を十分に反映 させることが可能となって、極めて効果的且つ効率的に楽曲の推薦を行うことが可能 となるのである。
[0054] また、この態様においては、前記範囲設定手段は、前記第 1更新範囲内に存在す る楽曲が推薦され、且つ前記推薦された楽曲が前記判別手段によって前記ユーザ の感性に合致していると判別された場合に、前記第 1の範囲を大きくする方向に更新 してもよい。また、前記範囲設定手段は、前記第 2更新範囲内に存在する楽曲が推 薦され、且つ前記推薦された楽曲が前記判別手段によって前記ユーザの感性に合 致していないと判別された場合に、前記第 1の範囲を小さくする方向に更新してもよ い。
[0055] この態様によれば、第 1更新範囲に属する楽曲がユーザの感性に合致している場 合には第 1の範囲が大きくなり、第 2更新範囲に属する楽曲がユーザの感性に合致 しない場合には、第 1の範囲が小さくなるため、ユーザの感性を極めて効果的に反映 させることが可會となる。
[0056] 第 1及び第 2更新範囲を第 1の範囲の更新の条件として使用する本発明の楽曲推 薦装置の一の態様では、前記範囲設定手段は、(i)前記更新が行われる前後におけ る前記 Rを夫々 R及び R 、 (ii)
n n+ 1 前記 n次元座標系にお ヽて前記基準座標点から前 記推薦された楽曲に対応する座標点までの距離を d (d:正の実数)、及び (m)更新係 数をひ (0< αく 1)とした場合に、 R = a d+ (l - a ) Rなる数式に従って、前記 n+ 1 n
第 1の範囲を更新する。
[0057] この態様によれば、上記数式に基づいて、常時効果的に第 1の範囲を更新すること が可能となる。また、更新係数の設定値によって、第 1の範囲の収束速度を重視した り、ユーザの感性の揺らぎも考慮して慎重に第 1の範囲を更新させたりすることも容易 にして可能となる。尚、更新係数 αの値は、上記範囲内において如何なる値に設定 されてもよいが、実験的、経験的、或いはシミュレーションなどの手法によって、予め 最適な、又は最適と判断、予測、推測、若しくは類推し得る値が判明している場合に は、そのような値に設定されていてもよい。例えば、更新係数を「0. 05」程度に設定 した場合には、第 1の範囲の収束速度と、第 1の範囲の信憑性を両方とも担保するこ とが比較的に可能となるので好適である。
[0058] 本発明の楽曲推薦装置の他の態様では、前記特徴項目は、和音変化率、 1分当た りのビート数、ビートの最大振幅、楽音信号強度の平均、及び楽音信号の最大振幅 のうち少なくとも一つの項目を含む。
[0059] 特徴項目は、楽曲の感性的な特徴を、定量的に或いは数値的に表すことが可能で ある限りにおいて、如何なる項目であってもよいが、例えばここで述べられるような、 和音変化率、 1分当たりのビート数、ビートの最大振幅、楽音信号強度の平均、及び 楽音信号の最大振幅の少なくとも一つを特徴項目として含んだ場合には、楽曲の特 徴を比較的良好に表すことが可能となる。
[0060] 例えば、和音変化率が比較的に大きければ、比較的に賑やかな楽曲である可能性 が高ぐ和音変化率が比較的に小さければ、比較的に静かな楽曲である可能性が高 い。例えば、 1分当たりのビート数が比較的に大きければ、比較的に元気な、又は楽 しい楽曲である可能性が高ぐ 1分当たりのビート数が比較的に小さければ、比較的 に穏ゃ力な楽曲である可能性が高い。例えば、ビートの最大振幅が比較的に大きけ れば、比較的に激しい楽曲である可能性が高ぐビートの最大振幅が比較的に小さ ければ、比較的に穏ゃ力な楽曲である可能性が高い。例えば、楽音信号強度の平 均が比較的に大きければ、比較的に元気な楽曲である可能性が高ぐ楽音信号強 度の平均が比較的に小さければ、比較的に静かな楽曲である可能性が高い。或い は、例えば、楽音信号の最大振幅が比較的に大きければ、比較的に情熱的な楽曲 である可能性が高ぐ楽音信号の最大振幅が比較的に小さければ、比較的に暗い楽 曲である可能性が高い。
<楽曲推薦方法 >
本発明の楽曲推薦方法は上記課題を解決するために、複数の楽曲夫々の特徴を 表すために予め定められた n (但し、 nは自然数)種類の特徴項目毎に定量化された n個の楽曲特徴量を n本の座標軸とする n次元座標系において、複数の検索キーヮ ード各々に付与された前記 n個の楽曲特徴量を包含する範囲を規定する第 1の範囲 を設定する範囲設定工程と、前記複数の検索キーワードのうち、所望の検索キーヮ ードを入力する入力工程と、前記入力工程において前記所望の検索キーワードが入 力された場合に、前記複数の楽曲の中から、前記 n次元座標系において (i)前記所 望の検索キーワードに対応する第 1の範囲又は、(ii)前記第 1の範囲を含む第 2の範 囲に属する、前記 n個の楽曲特徴量を有する一又は複数の楽曲を検索してユーザに 推薦する推薦工程と、前記推薦された楽曲が前記ユーザの感性に合致しているか否 かを判別する判別工程とを具備し、前記範囲設定工程は、前記判別工程における判 別結果に基づいて、前記所望の検索キーワードに対応する第 1の範囲を更新する。
[0061] 本発明の楽曲推薦方法によれば、上述した本発明の楽曲推薦装置における各手 段と対応する各工程によって、上述した本発明の楽曲推薦装置が奏する効果を簡便 に実現可能である。
[0062] 以上説明したように、本発明の楽曲推薦装置によれば、範囲設定手段、入力手段 、推薦手段、及び判別手段を具備するので、ユーザ毎に適切な楽曲の推薦を行うこ とが可能となる。本発明の楽曲推薦方法によれば、範囲設定工程、入力工程、推薦 工程、及び判別工程を具備するので、楽曲推薦装置が奏する効果を簡便に実現可 能である。
[0063] 本発明のこのような作用及び他の利得は次に説明する実施例から明らかにされる。
図面の簡単な説明
[0064] [図 1]本発明の実施例に係る車載用電子機器のブロック図である。
[図 2]図 1の車載用電子機器においてメモリに格納される楽曲テーブルの模式図であ る。
[図 3]図 1の車載用電子機器においてメモリに格納される検索テーブルの模式図であ る。
[図 4]楽曲推薦処理に係る検索座標平面の模式図である。
[図 5]楽曲推薦処理に係る楽曲 Miが配置された検索座標平面の模式図である。
[図 6]楽曲推薦処理のフローチャートである。
[図 7]楽曲推薦処理に係る検索座標平面の他の模式図である。
符号の説明
[0065] 10…車載用電子機器、 20· ··バスライン、 100…ナビゲーシヨン処理系、 200· ··共 通処理系、 210"-MCU、 220· ··抽出部、 230· "CDZDVDドライブ、 240· ··無線通 信装置、 250…表示部、 251…表示制御部、 252· ··グラフィックコントローラ、 253· ·· ノ ッファメモリ、 260…入力装置、 270· "メモリ、 280…音声認識処理部、 290…圧縮 '伸長処理部、 300…オーディオ処理系、 310…ハードディスク装置、 320…音声出 力部、 321- DZA部、 322· ··可変増幅器、 323a, 323b…スピーカ。
発明を実施するための最良の形態
[0066] 以下、本発明を実施するための最良の形態について実施例毎に順に図面に基づ いて説明する。
[0067] 以下、図面を参照して、本発明の好適な実施例について説明する。
<実施例の構成 >
始めに、図 1を参照して、本発明の実施例に係る車載用電子機器の構成について 説明する。ここに、図 1は車載用電子機器 10ブロック図である。
[0068] 図 1において、車載用電子機器 10は、車両搭載のオーディオ部とナビゲーシヨン部 とを一体化し、更に通信ネットワークを通じて音楽データやナビゲーシヨン用地図を 取り込む車載用電子機器として構成されている。尚、本実施例の車載用電子機器に おいては、予めユーザ側の処理によってハードディスク装置(HDD)に多数の楽曲( 例えば、データ圧縮音楽: MPEG— 1 Audio Layer— 3Z通称 MP3)を格納しているか 、又は、ユーザ側の処理によって通信ネットワーク(特にインターネット)上の音楽ゥェ ブサイトからダウンロードによる多数の圧縮楽曲データをノヽードディスクに格納してい るちのとする。
[0069] 図 1において、車載用電子機器 10は、ナビゲーシヨン処理系 100、共通処理系 20 0、及びオーディオ処理系 300からなる。
[0070] ナビゲーシヨン処理系 100は、自立測位装置や GPS受信機力も構成されて 、る。
尚、このナビゲーシヨン処理系 100は本発明に直接かかわらないため、以下におい て、その構成動作の説明を省略する。また、この種の車載用電子機器 10は、入出力 (I/O)回路、外部インタフェース (IZF)部等が設けられるが、その図示を省略した。
[0071] 共通処理系 200は、 MCU (Micro Controller Unit) 210、抽出部 220、 CD/DVD ドライブ 230、無線通信装置 240、表示部 250、入力装置 260、メモリ 270、音声認 識処理部 280及び圧縮,伸長処理部 290から構成されている。
[0072] オーディオ処理系 300は、ハードディスク装置 (HDD) 310及び音声出力部 320か ら構成されている。
[0073] 次に、図 1の各部の詳細な構成及び動作 (処理)について説明する。
[0074] MCU210は、この装置全体を制御するシステムコントローラであり、後述する楽曲 推薦処理を実行する。また、 MCU210は、 CPU211と不揮発性固体記憶素子であ る ROM212及びワーキング用の RAM213から構成され、バスライン 20に接続され た各部とデータをやり取りしている。このデータのやり取りによる処理制御は ROM21 2に格納されているブートプログラム及び制御プログラムによって実行される。 RAM2 13は、特に、入力装置 260からユーザ操作による CPU211の処理データを一時的 に格納するワーキング処理を行っている。尚、 CPU211は、本発明に係る「範囲設定 手段」、「推薦手段」、及び「判別手段」の夫々一例として機能する。
[0075] 抽出部 220は、本発明に係る「抽出手段」の一例である。抽出部 220は、ユーザが 、ハードディスク装置に格納された、或いは、 CDや DVDなどの各種記録媒体に記 録された楽曲を再生する際に、この再生された楽曲の特徴を、特徴項目の楽曲特徴 量として抽出することが可能に構成されている。特徴項目とは、例えば、和音変化率 、 1分当たりのビート数、ビートの最大振幅、楽音信号強度の平均、及び楽音信号の 最大振幅などを表す項目の少なくとも一部或いは全体を含み、楽曲の感性的な特徴 を定量的に表すことが可能な少なくとも一つの指標を指す。本実施例において、特 徴項目は、説明の簡略ィ匕を図るため、「第 1特徴項目」及び「第 2特徴項目」の二種類 の特徴項目力らなるものとする。この抽出部 220によって抽出された楽曲特徴量は、 書換え可能な記録媒体であるメモリ 270に楽曲テーブルとして格納される。尚、係る 楽曲テーブルについては後述する。
[0076] CDZDVDドライブ 230は、 CD231又は DVD232から音楽データ、映像データ、 テキストデータ、地図データ等を読み出す共通ドライブである。尚、 CDZDVDドライ ブ 230は、夫々の媒体毎に個別に設けられていてもよいし、いずれか一方のみが設 けられていてもよい。但し、音楽データ等を、無線通信装置 240を介して通信により 取り込む場合には、 CDZDVDドライブ 230などの大容量記憶装置を設けないように することも可會である。
[0077] ハードディスク装置 (HDD) 310は、前記したように多数の曲(圧縮音楽データ)を 格納している。即ち、ユーザ側で、例えば無線通信装置 240を介してダウンロードに よる多数の圧縮音楽データを格納している。若しくは、 CDZDVDドライブ 230によつ て、 CD231又は DVD232から読み出した多数の音楽データを格納している。
[0078] ノヽードディスク装置 310は、予めユーザ側の処理によって CDZDVDドライブ 230 で読み込まれた音楽データ、映像データ、テキストデータ、地図データ等を格納し、 この格納後に任意の時点で読み出すことが出来る。これにより例えば、 CD231や D VD232上の地図データを読み出してナビゲーシヨン動作を行いながら、ハードディ スク装置 310に格納された音声データや映像を読み出して音声出力や映像出力が 可能となる。或いは、 CD231や DVD232上の音声データや映像データを読み出し て音声出力や映像出力を行いながら、ハードディスク装置 310に格納された地図デ ータを読み出してナビゲーシヨン動作が可能となる。更に、予めユーザ側の処理によ つて無線通信装置 240によりダウンロードした音声データや映像データ或いは地図 データ等をノ、ードディスク装置 310に格納しておき、その後の任意の時点でこれを読 み出して出力可能となる。
[0079] 無線通信装置 240は、ハードディスク装置 310に通信ネットワーク上の音楽データ を取り込む (受信)ものであり、汎用携帯電話機と同様の構成である。例えば、 PDC(P ersonal Digitalし ellular Telecommunication System)方式、 PH¾ (Personal Handyphon e System)方式の TDMA、 TDD、 CDMA構成(高周波無線送受信部、符号化復号 化部、時分割多重化部、制御部、音声入出力部等)として知られた構成である。
[0080] 表示部 250は、 MCU210の制御で各種処理データを画面表示する。表示部 250 は、内部のグラフィックコントローラ 252力 バスライン 20を通じて CPU211から転送 される制御データに基づいて表示制御部 251の各部の制御を行う。また、 V— RAM などを用いたバッファメモリ 253が、表示可能な画像情報を一時的に記憶する。さら に、表示制御部 251が表示制御を行う。また、液晶ディスプレイ (LCD)、 EL (Electro -Luminescence)ディスプレイ、又はブラウン管(CRT)によって構成されるディスプレ ィ 254力 グラフィックコントローラ 252から出力される画像データを画面表示する。こ のディスプレイ 254は、例えば車内のフロントパネル近傍に配置される。
[0081] 音声出力部 320は、内部の DZAコンバータ 321が、 MCU210の制御でデジタル 音声信号を音声アナログ信号に変換し、かつ、可変増幅器 (AMP) 322が、ユーザ による入力操作で可変増幅してスピーカ 323a及び 323bに出力する。
[0082] 入力装置 260は、各種コマンドやデータを入力するための各種キーやボタンスイツ チ、リモートコントローラなど力も構成された、本発明に係る「入力手段」の一例である
[0083] 音声認識処理部 280は、デジタルシグナルプロセッサ(DSP)などで構成され、マイ クロホン力もの音声入力操作 (例えば、音楽再生指示入力)の音声信号を識別した 各種コマンドやデータを MCU210に転送する。この例では、音楽再生オン Zオフや 選曲の入力指示や、選曲リスト上又は選曲後に再生中の音楽再生のスキップ指示を 、音声認識 (例えば、線形予測法スペクトル分析)によって行うことが出来るようになつ ている。
[0084] 圧縮'伸長処理部 290は、デジタルシグナルプロセッサ(DSP)などで構成され、音 楽データをノ、ードディスク装置 310への格納時に圧縮し、かつ、再生時に伸長 (復調 、例えば、前記した MPEG— 1方式)する。
[0085] 尚、音声認識処理部 280及び圧縮'伸長処理部 290は、デジタルシグナルプロセ ッサ(DSP)などで構成せずに、専用のユーテリティソフトウェアを実装し、このソフトゥ エア(プログラム)を MCU210が実行して、同様の処理を行うようにしてもよい。
[0086] 次に、図 2及び図 3を参照して、メモリ 270の詳細構成について詳述する。ここに、 図 2は、楽曲テーブル 271の模式図であり、図 3は、検索テーブル 272の模式図であ る。尚、メモリ 270は、本発明に係る「第 1記憶手段」及び「第 2記憶手段」の夫々一例 として機能するように構成されて ヽる。
[0087] 図 2において、楽曲テーブル 271は、ハードディスク装置 310に格納された複数の 楽曲のうち、抽出部 220によってその感性的な特徴が第 1特徴項目及び第 2特徴項 目夫々における楽曲特徴量として抽出された楽曲 Mi (i= l, 2, · · · , n)について作 成された、所謂 LUT(Look Up Table)の一種である。
[0088] 例えば、楽曲 Mlには、第 1特徴項目における楽曲特徴量が「0. 1」、第 2特徴項目 における楽曲特徴量が「0. 5」と与えられている。尚、これら本実施例において、これ ら楽曲特徴量は、抽出部 220によって抽出された各楽曲特徴量に対し、 MCU210 が正規化処理を施した結果としての楽曲特徴量である。即ち、本実施例において、 各特徴項目の楽曲特徴量には、 0から 1までの実数値が割り当てられている。
[0089] 図 3において、検索テーブル 272は、予め設定されている複数の検索キーワード Ki
(i= l, 2, · · · , n)に対し、楽曲テーブル 271と同様に特徴項目の楽曲特徴量が割り 当てられた更新可能な LUTである。但し、この楽曲特徴量は抽出部 220によって抽 出されるものではなぐ予め MCU210内の ROM212に固定値として格納されたもの である。即ち、 MCU210は、 ROM212からこれら楽曲特徴量を読み出して、メモリ 2
70上に検索テーブル 272を生成する。検索キーワードとは、例えば、「楽しい」、「元 気」、「賑やか」、「ノリが良い」など楽曲の感性的な特徴を指し示す言葉であり、これら 検索キーワードに割り当てられる特徴項目各々の楽曲特徴量とは、これら検索キーヮ ードによって表される感性的な特徴に最も当てはまる楽曲特徴量である。これら検索 キーワードに割り当てられる楽曲特徴量は、予め実験的、経験的、或いはシミュレ一 シヨンなどの手法によって、最適な値が与えられて 、る。
[0090] 一方、検索テーブル 272には、これら特徴項目の楽曲特徴量の他に、「半径 R」な る項目が設定され、格納されている。ここで、図 4を参照して、この半径 Rについて説 明する。ここに、図 4は、検索座標平面の模式図である。
[0091] 図 4にお ヽて、検索座標平面とは、 2種類の特徴項目を縦軸及び横軸とする座標 平面であり、夫々における楽曲特徴量が座標値に相当する。検索座標平面は、本発 明に係る「n次元座標系」の一例である。
[0092] この検索座標平面においては、各検索キーワードを、夫々に割り当てられた楽曲特 徴量に対応する座標点に配置することができる。夫々の検索キーワードに対応する 座標点は、即ち、本発明に係る「基準座標点」の一例である。
[0093] ここで、例えば検索キーワード Knを例に挙げると、横軸及び縦軸の座標値が夫々 0
. 5及び 0. 6に相当する座標点が基準座標点となる。この基準座標点は、検索座標 平面内において、夫々の検索キーワードが示す感性的な特徴を最も適切に示す座 標点であるが、この基準座標点の周辺領域も、同程度にこの感性的な特徴に適合す ると考えられることは、視覚的にみても明らかである。
[0094] そこで、本実施例においては、検索キーワード Ki各々における基準座標点を中心 とした円を規定し、係る円内に相当する範囲は、検索キーワード Kiに合致する範囲 であるとする。即ち、この検索キーワード Ki毎に設定される円内は、本発明に係る「第 1の範囲」の一例たる「合致範囲」となる。検索テーブル 272に格納される「半径 R」と は、この合致範囲の半径を表している。
[0095] この合致範囲の半径 Rは、検索テーブル 272上において更新可能に設定されてお り、その初期値は、例えば車載用電子機器 10の工場出荷時などに ROM212に格納 されている。 MCU210は、検索テーブル 272を生成する際に、この ROM212から初 期値を読み出し、初期の検索テーブル 272を生成する。図 3における検索テーブル 272は、初期値として「0. 2」が与えられていることを示している。
[0096] ここで、図 5を参照して、検索座標平面内における、楽曲 Miと検索キーワード Kiと の関係について説明する。ここに、図 5は、楽曲 Miが配置された検索座標平面の模 式図である。
[0097] 図 5において、楽曲 Miが夫々抽出部 220によって抽出された楽曲特徴量に対応す る座標点に配置されている。このうち、検索キーワード Knに対応する合致範囲(半径 Rnは初期値)には楽曲 Mnが属している。また、検索キーワード K1に対応する合致 範囲には楽曲 M3が、検索キーワード K3に対応する合致範囲には楽曲 M2が夫々 属している。一方、検索キーワード K2に対応する合致範囲には如何なる楽曲も含ま れない。また楽曲 Mlは、如何なる検索キーワードに対応する合致範囲にも含まれな い。
[0098] 夫々合致範囲に属する楽曲は、本実施例において、検索キーワードに合致する楽 曲として扱われる。例えば、検索キーワード Knが「楽しい曲」なるキーワードである場 合には、楽曲 Mnは楽しい楽曲であることを意味する。
<実施例の動作 >
次に、図 6を参照して、上記構成を有する車載用電子機器 10の動作について説明 する。ここに、図 6は、 MCU210が ROM212に格納される楽曲推薦プログラムを実 行することによって実現される、楽曲推薦処理のフローチャートである。尚、図 6に係 る処理が開始される前段階として、ユーザ力も入力装置 260を介して検索キーワード Knが入力されて!、るものとする。
[0099] 図 6において、始めに、 CPU211は、メモリ 270に格納されている楽曲テーブル 27 1及び検索テーブル 272を参照し、ハードディスク装置 310に記憶されている楽曲の 中から、「推薦範囲」に属する楽曲を検索すると共に、該当する楽曲が存在する場合 には、音声出力部 320に楽曲データを供給する。この楽曲は、音声出力部 320によ つて処理され、スピーカ 323a及び 323bから放音される(ステップ S 10)。ユーザは、 この時点で、この楽曲を視¾することとなる。
[0100] ここで、図 7を参照して「推薦範囲」について説明する。ここに、図 7は、検索座標平 面の他の模式図である。尚、図 7に係る検索座標平面には、楽曲 Mni(i= l, 2, · · · , 7)が配置されている。
[0101] 図 7において、検索キーワード Knの基準座標点から半径 Rによって規定される円 内力 前述した合致範囲である。それに対し、更に半径をマージン rの分だけ拡張し た範囲が、本発明に係る「第 2の範囲」の一例たる「推薦範囲」となる。尚、本実施例 において、マージン rの値は、合致範囲の半径 Rの 10%に相当する値に設定されて いる。図 7において、合致範囲の半径 Rは初期値「0. 2」であるから、図 7においてマ 一ジン rは「0. 02」に設定されており、推薦範囲は、基準座標点を中心とした半径 0. 22の円内に相当する範囲となる。
[0102] 推薦範囲は、合致範囲を含み、合致範囲よりも大きい範囲であるから、検索座標平 面の概念上、検索キーワード Knに合致しないと考えられる楽曲も含まれている。例え ば、楽曲 Mn5は、本来検索キーワード Knには合致しない楽曲である力 推薦範囲 には含まれて!/ヽるため、 CPU211はこの楽曲 Mn5も選択対象として認識する。
[0103] CPU211は、推薦範囲に属する楽曲を順次選択し、再生を行う。尚、 CPU211は 、ユーザから一の検索キーワードが入力された際、常に推薦範囲から楽曲を選択、 再生する必要はない。例えば、通常は合致範囲に属する楽曲の中から楽曲を選択 及び再生し、適当なタイミングで推薦範囲に属する楽曲を選択及び再生してもよい。
[0104] ユーザは再生される楽曲を自らの判断により評価し、入力装置 260、又は音声認識 処理部 280を介して CPU211にフィードバックする(ステップ S 11)。このフィードバッ クは、例えば、ユーザが、この楽曲が検索キーワード Knに合致しないと判断した場合 には「非合致」を表すボタンスィッチを選択し入力することによりなされる。或いは、ュ 一ザ力 この楽曲が検索キーワード Knに合致しないと判断した場合には「スキップ」 などと発声することによりなされる。尚、ユーザによる積極的なフィードバックが無い場 合には、 CPU211は、この楽曲がユーザの感性に合致していると判断する。従って、 ステップ S11において、「フィードバック」とは、必ずしもユーザ側力もの積極的なリア クシヨンを指すものではなぐ楽曲推薦処理に係る処理は継続する。ユーザによるフィ ードバック結果は、積極的又は非積極的の別によらず、一時的に RAM213に格納さ れる。
[0105] 次に、 CPU211は、再生中の楽曲が第 1更新範囲内の楽曲であるか否かを判別す る (ステップ S12)。第 1更新範囲内の楽曲では無い場合には (ステップ S12 :NO)、 CPU211は更に再生中の楽曲が第 2更新範囲内の楽曲である力否かを判別する( ステップ S 15)。
[0106] ここで、第 1更新範囲及び第 2更新範囲について、再び図 7を参照して説明する。
[0107] 図 7において、第 1更新範囲とは、基準座標点力もの距離を Sとした場合に、「Rく S ≤R+r」によって規定される範囲を指す。第 2更新範囲とは、基準座標点からの距離 力 「R— r≤S<R」によって規定される範囲を指す。例えば、図 7において、第 1更 新範囲に属する楽曲は楽曲 Mn5であり、第 2更新範囲に属する楽曲は楽曲 Mn4で ある。本実施例においては、第 1及び第 2更新範囲に属する楽曲が選択、再生され た場合のみ、ユーザの感性を反映して入力された検索キーワードに対応する合致範 囲が更新される。
[0108] 図 6に戻り、再生中の楽曲が第 1更新範囲内であった場合 (ステップ S12 : YES)、 CPU211は RAM213からユーザのフィードバック結果を取得し、この楽曲がユーザ の感性に合致している力否かを判別する(ステップ S 13)。尚、この時点において、 R AM213にユーザのフィードバック結果が格納されて 、な 、場合、 CPU211は係る 結果が格納されるまで処理を中断する。尚、 CPU211が、再生中の楽曲がユーザの 感性に合致して 、ると判断する時間は、どのような時間に設定されて 、ても構わな ヽ 。例えば、楽曲全体の演奏時間の 80%に相当する時間ユーザ力も何の入力も無い 場合に、 CPU211が、係る楽曲がユーザの感性に合致していると判別するように動 作する場合には、 CPU211は、係る時間が経過するまで処理を中断する。無論、そ の間にユーザから「非合致」を表す旨の入力があった場合には、その時点で RAM2 13にその旨が格納され、 CPU211はステップ S 13に係る判別処理を行うことが可能 である。
[0109] 再生中の楽曲がユーザの感性に合致していた場合 (ステップ S13 : YES)、 CPU2 11は、検索キーワード Knに対応する合致範囲を、拡大方向に更新する (ステップ S1 4)。即ち、合致範囲の半径 Rの値が大きくなるように更新する。
[0110] ここで、本実施例において、 CPU211は下記数式(1)に従って、半径 Rの値を更新 する。更新された合致範囲は、より具体的には更新された半径 Rの値は、検索キーヮ ード Knに対する最新の半径 Rとして、検索テーブル 272に格納される。
[0111] R = a d+ (l - a )R (1)
n+l n
ここで、 Rnは、 n— 1回目の更新時における半径 Rの値であり、 Rn+ 1は n回目の更 新後における半径 Rの値を示す。また、 αは更新係数であり、「0< α < 1」なる範囲 で規定され、本実施例では「0. 05」に設定されている。また、 dは、検索座標平面に おいて基準座標点力 再生中の楽曲までの距離を表す(図 7参照)。例えば、再生中 の楽曲が、図 7における楽曲 Mn5である場合、この楽曲がユーザの感性に合致して いた場合には、上式に従って、検索キーワード Knに対する合致範囲が更新される。 また、再生中の楽曲がユーザの感性に合致していな力つた場合には (ステップ S13 : NO)、 CPU211は合致範囲の更新を行わずに、ステップ S 10に処理を戻し、次なる 楽曲の再生を始める。ここで、更新が行われない理由は、元々楽曲 Mn5は検索キー ワード Knに合致しない楽曲であるから、ユーザが合致しないと判断したならば、この 検索キーワード Knに対応する合致範囲は正しいものであり、更新の必要が生じない 力 である。
[0112] 一方、再生中の楽曲が第 1更新範囲に属さない場合 (ステップ S12 :NO)、ステツ プ S 15に係る処理が行われる。再生中の楽曲が第 2更新範囲内であった場合 (ステ ップ S 15: YES)、 CPU211は RAM213からユーザのフィードバック結果を取得し、 この楽曲がユーザの感性に非合致である力否かを判別する (ステップ S16)。尚、こ の時点にお 、て、 RAM213にユーザのフィードバック結果が格納されて ヽな 、場合 、ステップ S13と同様に、 CPU211は係る結果が格納されるまで処理を中断する。
[0113] 再生中の楽曲がユーザの感性に合致しな力つた場合には (ステップ S16 : YES)、 CPU211は、検索キーワード Knに対応する合致範囲を縮小方向に更新する (ステツ プ S17)。この際も、上記(1)式に基づいて合致範囲の更新が行われる。例えば、再 生中の楽曲が、図 7における楽曲 Mn4である場合、この楽曲がユーザの感性に合致 していなかった場合には、上式に従って、検索キーワード Knに対する合致範囲が更 新される。
[0114] 再生中の楽曲がユーザの感性に合致していた場合には (ステップ S16 :NO)、 CP U211は検索キーワード Knに対応する合致範囲の更新を行わずに、ステップ S 10に 処理を戻し、次なる楽曲の再生を始める。
[0115] また、再生中の楽曲が第 2更新範囲内の楽曲ではない場合 (ステップ S15 :NO)に も、合致範囲の更新は行われずに、ステップ S 10に処理が移行する。例えば、図 7に おいて、再生中の楽曲が楽曲 Mnl、 Mn2、又は Mn3である場合、これらの楽曲は 基準座標点からの距離が「R—r」よりも小さいから、ユーザのフィードバックによらず 合致範囲は更新されない。
[0116] このように、合致範囲の更新が行われるか、再生中の楽曲が第 1及び第 2更新範囲 内に属さない楽曲である力、再生中の楽曲が第 1更新範囲内であってユーザの感性 に合致しない楽曲であった力、又は再生中の楽曲が第 2更新範囲内であってユーザ の感性に合致して 、る楽曲であった場合、現在再生中の楽曲に関する処理は終了 し、 CPU211は処理をステップ S10に戻して、再生順位が次なる楽曲の再生を開始 する。
[0117] 本実施例に係る車載用電子機器 10は、以上のようにして、検索キーワードに対す る合致範囲を更新することが可能に構成されている。従って、ユーザ毎に異なる感性 を反映し、ユーザ毎に適切な楽曲を推薦することが可能なのである。
[0118] 例えば、図 7において、楽曲 Mn6及び Mn7は、合致範囲が初期値に基づいて決 定されている場合には、推薦範囲の外側にあり、検索キーワード Knが入力された場 合に装置側で推薦を行うことはない楽曲である。し力しながら、一のユーザが、検索 キーワード Knに対して広い感度をもっている場合、即ち、大抵の曲は検索キーヮー ド Κηに合致すると感じてしまうユーザであった場合には、上記(1)式に基づく合致範 囲の更新処理によって、幾度目かの更新時には、これらの楽曲が推薦範囲に入るこ とも有り得る。逆に、他のユーザが、検索キーワード Κηに対して狭い感度をもってい る場合、即ち、大抵の曲は検索キーワード Κηに合致しないと感じてしまうユーザであ つた場合には、幾度目かの更新時に楽曲 Mnl、 Μη2及び Μη3が推薦範囲力も漏 れる可能性も有る。従って、初期状態は等しくても、時間経過と共に、ユーザ各々の 感性が十分に反映されるのである。
[0119] 尚、本実施例においては、特徴項目は 2種類の場合として説明したが、無論、特徴 項目は 3種類であってもよいし、もっと多種類であってもよい。或いは 1種類のみであ つてもよい。この場合、本発明に係る座標系の態様も、夫々、 3次元座標空間、多次 元座標空間、或 ヽは 1次元座標軸などの態様を採り得る。
[0120] 尚、本実施例においては、合致範囲を、基準座標点を中心とした円として設定した 力 合致範囲の形状は、検索キーワードが示す感性的な特徴に合致していると判断 し得る範囲である限りにおいて、如何なる形状であってもよい。例えば、楕円形状で あってもよい。この場合、実施例で示したように単純に半径 Rの値に基づいて合致範 囲を設定又は更新することが困難であるが、縦軸及び横軸に相当する楽曲特徴量の 重み付けを考慮した上で、これらの比率が維持されるように拡大及び縮小することは 容易にして可能であり、実処理上の問題は生じにくぐ本発明に係る効果は十分に 担保される。
[0121] 本発明は、上述した実施例に限られるものではなぐ請求の範囲及び明細書全体 力 読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、その ような変更を伴う楽曲推薦装置、及び方法もまた本発明の技術的範囲に含まれるも のである。
産業上の利用可能性
[0122] 本発明に係る楽曲推薦装置及び方法は、例えば、多数の楽曲の中からユーザの 感性に応じた楽曲を提供可能なカーオーディオ、ステレオに利用可能である。

Claims

請求の範囲
[1] 複数の楽曲各々の特徴を表すために予め定められた n (但し、 nは自然数)種類の 特徴項目毎に定量ィ匕された n個の楽曲特徴量を n本の座標軸とする n次元座標系に おいて、複数の検索キーワード各々に付与された前記 n個の楽曲特徴量を包含する 範囲を規定する第 1の範囲を設定する範囲設定手段と、
前記複数の検索キーワードのうち、所望の検索キーワードを入力可能な入力手段と 前記入力手段を介して前記所望の検索キーワードが入力された場合に、前記複数 の楽曲の中から、前記 n次元座標系において (i)前記所望の検索キーワードに対応 する第 1の範囲又は、(ii)前記第 1の範囲を含む第 2の範囲に属する、前記 n個の楽 曲特徴量を有する一又は複数の楽曲を検索してユーザに推薦する推薦手段と、 前記推薦された楽曲が前記ユーザの感性に合致しているか否かを判別する判別 手段と
を具備し、
前記範囲設定手段は、前記判別手段による判別結果に基づいて、前記所望の検 索キーワードに対応する第 1の範囲を更新する
ことを特徴とする楽曲推薦装置。
[2] 前記複数の楽曲各々について、前記 n個の楽曲特徴量を抽出する抽出手段と、 前記抽出された楽曲特徴量を、前記複数の楽曲各々に対応付けて記憶する第 1記 憶手段と
を更に具備することを特徴とする請求の範囲第 1項に記載の楽曲推薦装置。
[3] 前記設定された第 1の範囲を、前記複数の検索キーワード夫々に対応付けて格納 する第 2記憶手段を更に具備し、
前記範囲設定手段は、前記第 2記憶手段に格納された前記第 1の範囲を更新する ことを特徴とする請求の範囲第 1項に記載の楽曲推薦装置。
[4] 前記判別手段は、前記ユーザの個別判断に基づいて、前記推薦された楽曲が前 記ユーザの感性に合致している力否かを判別する
ことを特徴とする請求の範囲第 1項に記載の楽曲推薦装置。
[5] 前記範囲設定手段は、前記 n次元座標系において、前記所望の検索キーワードに 付与された楽曲特徴量によって規定される基準座標点力ゝらの距離が R (R:正の実数
)である点の集合を、前記第 1の範囲の境界として設定する
ことを特徴とする請求の範囲第 1項に記載の楽曲推薦装置。
[6] 前記推薦手段は、前記第 2の範囲を、前記 n次元座標系にお 、て前記第 1の範囲 を所定の割合で拡大した範囲に設定する
ことを特徴とする請求の範囲第 1項に記載の楽曲推薦装置。
[7] 前記推薦手段は、前記基準座標点からの距離が、前記 Rと所定のマージン r(r:R よりも小さい正の実数)とを加算した値となる点の集合を、前記第 2の範囲の境界とし て設定する
ことを特徴とする請求の範囲第 5項に記載の楽曲推薦装置。
[8] 前記範囲設定手段は、前記 n次元座標系において、前記複数の楽曲のうち、前記 基準座標点からの距離が、 ( 前記 Rよりも大きく且つ前記 Rと前記マージン rとを加算 した値以下となる第 1更新範囲内、又は (ii)前記 Rよりも小さく且つ前記 Rから前記マ 一ジン rを減算した値以上となる第 2更新範囲内、に存在する楽曲が推薦された場合 に、前記判別手段による判別結果に基づいて前記第 1の範囲を更新する
ことを特徴とする請求の範囲第 7項に記載の楽曲推薦装置。
[9] 前記範囲設定手段は、前記第 1更新範囲内に存在する楽曲が推薦され、且つ前 記推薦された楽曲が前記判別手段によって前記ユーザの感性に合致していると判 別された場合に、前記第 1の範囲を大きくする方向に更新する
ことを特徴とする請求の範囲第 8項に記載の楽曲推薦装置。
[10] 前記範囲設定手段は、前記第 2更新範囲内に存在する楽曲が推薦され、且つ前 記推薦された楽曲が前記判別手段によって前記ユーザの感性に合致していないと 判別された場合に、前記第 1の範囲を小さくする方向に更新する
ことを特徴とする請求の範囲第 7項に記載の楽曲推薦装置。
[11] 前記範囲設定手段は、(i)前記更新が行われる前後における前記 Rを夫々 R及び R 、 (ii)前記 n次元座標系にお ヽて前記基準座標点から前記推薦された楽曲に対 n+ 1
応する座標点までの距離を d(d:正の実数)、及び (m)更新係数をひ (o< ひ < 1)とし た場合に、
R = a d+ (l - a ) Rなる数式に従って、前記第 1の範囲を更新する n+ 1 n
ことを特徴とする請求の範囲第 8項に記載の楽曲推薦装置。
[12] 前記特徴項目は、和音変化率、 1分当たりのビート数、ビートの最大振幅、楽音信 号強度の平均、及び楽音信号の最大振幅のうち少なくとも一つの項目を含む ことを特徴とする請求の範囲第 1項に記載の楽曲推薦装置。
[13] 複数の楽曲夫々の特徴を表すために予め定められた n (但し、 nは自然数)種類の 特徴項目毎に定量ィ匕された n個の楽曲特徴量を n本の座標軸とする n次元座標系に おいて、複数の検索キーワード各々に付与された前記 n個の楽曲特徴量を包含する 範囲を規定する第 1の範囲を設定する範囲設定工程と、
前記複数の検索キーワードのうち、所望の検索キーワードを入力する入力工程と、 前記入力工程において前記所望の検索キーワードが入力された場合に、前記複 数の楽曲の中から、前記 n次元座標系において (i)前記所望の検索キーワードに対 応する第 1の範囲又は、(ii)前記第 1の範囲を含む第 2の範囲に属する、前記 n個の 楽曲特徴量を有する一又は複数の楽曲を検索してユーザに推薦する推薦工程と、 前記推薦された楽曲が前記ユーザの感性に合致しているか否かを判別する判別 工程と
を具備し、
前記範囲設定工程は、前記判別工程における判別結果に基づいて、前記所望の 検索キーワードに対応する第 1の範囲を更新する
ことを特徴とする楽曲推薦方法。
PCT/JP2005/016642 2004-09-17 2005-09-09 楽曲推薦装置及び方法 WO2006030712A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006535849A JPWO2006030712A1 (ja) 2004-09-17 2005-09-09 楽曲推薦装置及び方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-271287 2004-09-17
JP2004271287 2004-09-17

Publications (1)

Publication Number Publication Date
WO2006030712A1 true WO2006030712A1 (ja) 2006-03-23

Family

ID=36059965

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/016642 WO2006030712A1 (ja) 2004-09-17 2005-09-09 楽曲推薦装置及び方法

Country Status (2)

Country Link
JP (1) JPWO2006030712A1 (ja)
WO (1) WO2006030712A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103832A (ja) * 2010-11-09 2012-05-31 Sony Corp 情報処理装置および方法、情報処理システム、並びに、プログラム
CN105608105A (zh) * 2015-10-30 2016-05-25 浙江大学 一种基于收听上下文的音乐推荐方法
WO2017166132A1 (zh) * 2016-03-30 2017-10-05 马岩 网络信息推送方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11184883A (ja) * 1997-12-24 1999-07-09 Canon Inc 楽曲検索システム、楽曲検索方法及び記録媒体
JP2002183152A (ja) * 2000-12-18 2002-06-28 Jinyama Shunichi 音楽検索装置及び方法並びに音楽検索用ソフトウェアを記録した記録媒体
JP2002278547A (ja) * 2001-03-22 2002-09-27 Matsushita Electric Ind Co Ltd 楽曲検索方法、楽曲検索用データ登録方法、楽曲検索装置及び楽曲検索用データ登録装置
JP2004199437A (ja) * 2002-12-19 2004-07-15 Link Cube Kk 検索装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11184883A (ja) * 1997-12-24 1999-07-09 Canon Inc 楽曲検索システム、楽曲検索方法及び記録媒体
JP2002183152A (ja) * 2000-12-18 2002-06-28 Jinyama Shunichi 音楽検索装置及び方法並びに音楽検索用ソフトウェアを記録した記録媒体
JP2002278547A (ja) * 2001-03-22 2002-09-27 Matsushita Electric Ind Co Ltd 楽曲検索方法、楽曲検索用データ登録方法、楽曲検索装置及び楽曲検索用データ登録装置
JP2004199437A (ja) * 2002-12-19 2004-07-15 Link Cube Kk 検索装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SATO S. ET AL: "Kanjo ni Motozuku Ongaku Sakuhin Kensaku System no Jitsugen ni Mukete no Kento (A Discussion about the Realization of Impression-based Retrieval System for Music Collection)", INFORMATION PROCESSING SOCIETY OF JAPAN KENKYU HOKOKU, NIPPON, INFORMATION PROCESSING SOCIETY OF JAPAN, vol. 2001, no. 16, 23 February 2001 (2001-02-23), pages 51 - 56, XP002998826 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103832A (ja) * 2010-11-09 2012-05-31 Sony Corp 情報処理装置および方法、情報処理システム、並びに、プログラム
CN105608105A (zh) * 2015-10-30 2016-05-25 浙江大学 一种基于收听上下文的音乐推荐方法
WO2017166132A1 (zh) * 2016-03-30 2017-10-05 马岩 网络信息推送方法及***

Also Published As

Publication number Publication date
JPWO2006030712A1 (ja) 2008-07-31

Similar Documents

Publication Publication Date Title
JP4037081B2 (ja) 情報選択装置及び方法、情報選択再生装置並びに情報選択のためのコンピュータプログラム
US20060224260A1 (en) Scan shuffle for building playlists
US7613736B2 (en) Sharing music essence in a recommendation system
US9495449B2 (en) Music steering with automatically detected musical attributes
KR100952186B1 (ko) 악곡들을 식별하는 방법
US20070157797A1 (en) Taste profile production apparatus, taste profile production method and profile production program
EP1420388A1 (en) Music searching method, music searching device, and music searching program
JP5594532B2 (ja) 情報処理装置および方法、情報処理システム、並びに、プログラム
CN110033789A (zh) 生物测定个性化音频处理***
EP1965322A1 (en) Information processing apparatus, information processing method, and information processing program
JP4322691B2 (ja) 選曲装置
JP5269829B2 (ja) カラオケシステム、カラオケシステムの制御方法、及びカラオケシステムの制御プログラム並びにその情報記録媒体
WO2006030712A1 (ja) 楽曲推薦装置及び方法
JP2010044756A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2005115164A (ja) 楽曲検索装置
JP2005346347A (ja) 情報検索装置、情報検索方法、情報検索プログラムおよび記録媒体
JP3714865B2 (ja) カラオケ自動選曲演奏システム
JPWO2006077769A1 (ja) 提示データ選択装置及び提示データ選択方法等
JP2005285285A (ja) コンテンツ読出装置及び楽曲再生装置
JP4279274B2 (ja) 携帯端末装置および楽曲情報表示方法
US20100058186A1 (en) Reproducing apparatus and reproducing method
JP2007316830A (ja) 情報処理装置及びコンテンツ検索プログラム
JP2006323438A (ja) 楽曲検索システム
JP2017084313A (ja) プレイリスト生成方法、プレイリスト生成装置、及びプログラム、並びに再生リスト生成方法
JPH11296181A (ja) 音楽再生装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2006535849

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase